Definição – o que significa o Data Sandbox?
Uma sandbox de dados, no contexto de big data, é uma plataforma escalonável e de desenvolvimento usada para explorar os ricos conjuntos de informações de uma organização por meio de interação e colaboração. Ele permite que uma empresa perceba seu valor real de investimento em big data.
Uma sandbox de dados é explorada principalmente por equipes de ciência de dados que obtêm plataformas de sandbox de datamarts analíticos autônomos ou partições lógicas em data warehouses corporativos.
As plataformas de sandbox de dados fornecem a computação necessária para que os cientistas de dados lidem com cargas de trabalho analíticas tipicamente complexas.
Definirtec explica Data Sandbox
Uma sandbox de dados inclui unidades de processamento central paralelas massivas, memória de ponta, armazenamento de alta capacidade e capacidade de I / O e normalmente separa os ambientes de experimentação de dados e de produção de banco de dados em data warehouses.
O IBM Netezza 1000 é um exemplo de plataforma de sandbox de dados que é um data mart analítico independente. Um exemplo de partição lógica em um data warehouse corporativo, que também serve como uma plataforma de sandbox de dados, é o IBM Smart Analytics System.
Um cluster Hadoop como o IBM InfoSphere BigInsights Enterprise Edition também está incluído nesta categoria.
Esta definição foi escrita no contexto de Big Data