Definição – o que significa Data Lake?
Um data lake é um repositório enorme, facilmente acessível e centralizado de grandes volumes de dados estruturados e não estruturados.
Definirtec explica Data Lake
A arquitetura do data lake é uma abordagem de armazenamento de tudo para big data. Os dados não são classificados quando são armazenados no repositório, pois o valor dos dados não é claro no início. Como resultado, a preparação de dados é eliminada. Um data lake é, portanto, menos estruturado em comparação com um data warehouse convencional. Quando os dados são acessados, só então são classificados, organizados ou analisados.
Hadoop, uma estrutura de código aberto para processamento e análise de big data, pode ser usado para filtrar os dados no repositório.