Definição – o que significa SQL no Hadoop?
SQL no Hadoop é um tipo de ferramenta de aplicativo analítico – a implementação SQL na plataforma Hadoop, que combina a consulta de dados estruturados no estilo SQL padrão com a estrutura de dados Hadoop. O Hadoop é uma plataforma relativamente nova, assim como o próprio big data, e poucos profissionais são especialistas nisso, mas o SQL no Hadoop simplifica o acesso à estrutura do Hadoop e facilita a implementação nos sistemas corporativos atuais.
Definirtec explica SQL no Hadoop
SQL no Hadoop refere-se a várias implementações de SQL para a plataforma Hadoop. MapReduce, que é o mapeador de tarefas de cluster e organizador de resultados do Hadoop, suporta SQL como um caso de uso principal, bem como outros métodos de processamento. Portanto, faz sentido criar ferramentas poderosas para permitir SQL, que é uma das linguagens mais amplamente utilizadas para consulta e manipulação de banco de dados. À medida que o Hadoop ganha popularidade para a arquitetura de dados corporativos, o SQL é a chave para a adoção adequada tanto de dados estruturados quanto de dados estruturados usados no Hadoop.
Os principais drivers do SQL no Hadoop incluem:
- Aproveitando as habilidades de SQL existentes, presentes na maioria das organizações
- Reutilização de carga de transformação de extração (ETL), inteligência de negócios (BI) e investimentos em infraestrutura analítica no Hadoop
Algumas implementações de SQL em Hadoop incluem:
- Apache Spark SQL
- Apache Hive
- Apache Tagus
- Apache Drill
- HP Vertica no MapR
- Drivers ODBC
- Presto
- tubarão