Definição – o que significa o Apache Sqoop?
Apache Sqoop (“SQL para Hadoop”) é um aplicativo de modo de console baseado em Java projetado para transferir dados em massa entre Apache Hadoop e datastores não Hadoop, como bancos de dados relacionais, bancos de dados NoSQL e armazéns de dados. A versão 1.4.4 foi lançada em 31 de julho de 2013.
Definirtec explica Apache Sqoop
As empresas que usam o Hadoop estão descobrindo que é necessário transferir alguns de seus dados de sistemas tradicionais de gerenciamento de banco de dados relacional (RDBMSs) para o ecossistema Hadoop.
O Sqoop, parte integrante do Hadoop, pode realizar essa transferência de maneira automatizada. Além disso, os dados importados para o Hadoop podem ser transformados com MapReduce antes de exportá-los de volta para o RDBMS. O Sqoop também pode gerar classes Java para interagir programaticamente com dados importados.
O Sqoop usa uma arquitetura baseada em conector que permite usar plug-ins para se conectar a bancos de dados externos.