Definição – O que significa o Data Cube?
Um cubo de dados refere-se a um intervalo tridimensional (3D) (ou superior) de valores que geralmente são usados para explicar a sequência de tempo dos dados de uma imagem. É uma abstração de dados para avaliar dados agregados de uma variedade de pontos de vista. Também é útil para espectroscopia de imagem, uma vez que uma imagem resolvida espectralmente é representada como um volume 3-D.
Um cubo de dados também pode ser descrito como as extensões multidimensionais de tabelas bidimensionais. Ele pode ser visto como uma coleção de tabelas 2-D idênticas empilhadas umas sobre as outras. Cubos de dados são usados para representar dados muito complexos para serem descritos por uma tabela de colunas e linhas. Assim, os cubos de dados podem ir muito além do 3-D para incluir muito mais dimensões.
Definirtec explica o Data Cube
Um cubo de dados geralmente é usado para interpretar dados facilmente. É especialmente útil ao representar dados junto com dimensões como certas medidas de requisitos de negócios. Cada dimensão de um cubo representa certas características do banco de dados, por exemplo, vendas diárias, mensais ou anuais. Os dados incluídos em um cubo de dados possibilitam a análise de quase todos os números de praticamente todos os clientes, agentes de vendas, produtos e muito mais. Assim, um cubo de dados pode ajudar a estabelecer tendências e analisar o desempenho.
Cubos de dados são categorizados principalmente em duas categorias:
- Cubo de dados multidimensional: a maioria dos produtos OLAP é desenvolvida com base em uma estrutura onde o cubo é padronizado como uma matriz multidimensional. Esses produtos OLAP multidimensionais (MOLAP) geralmente oferecem desempenho melhorado quando comparados a outras abordagens, principalmente porque podem ser indexados diretamente na estrutura do cubo de dados para reunir subconjuntos de dados. Quando o número de dimensões é maior, o cubo se torna mais esparso. Isso significa que várias células que representam combinações de atributos particulares não conterão nenhum dado agregado. Isso, por sua vez, aumenta os requisitos de armazenamento, que às vezes podem atingir níveis indesejáveis, tornando a solução MOLAP insustentável para grandes conjuntos de dados com muitas dimensões. As técnicas de compressão podem ajudar; no entanto, seu uso pode danificar a indexação natural do MOLAP.
- OLAP relacional: OLAP relacional faz uso do modelo de banco de dados relacional. O cubo de dados ROLAP é empregado como um monte de tabelas relacionais (aproximadamente o dobro da quantidade de dimensões) em comparação com uma matriz multidimensional. Cada uma dessas tabelas, conhecida como cuboide, significa uma visão específica.