Definição – o que significa o Apache Kudu?
Apache Kudu é membro do ecossistema Apache Hadoop de código aberto. É um mecanismo de armazenamento de código aberto destinado a dados estruturados que oferece suporte a acesso aleatório de baixa latência junto com padrões de acesso analítico eficientes. Ele foi projetado e implementado para preencher a lacuna entre o amplamente usado Hadoop Distributed File System (HDFS) e o banco de dados HBase NoSQL. Embora esses sistemas ainda possam ser vantajosos, o Apache Kudu pode atender a muitas cargas de trabalho comuns, pois pode simplificar drasticamente sua arquitetura.
Definirtec explica Apache Kudu
O Apache Kudu foi desenvolvido principalmente como um projeto em Cloudera. A maioria das contribuições até o momento foram de desenvolvedores contratados pela Cloudera. Durante seu lançamento, apenas binários de conveniência foram incluídos nos repositórios do Cloudera, no entanto, ele adotou o processo de lançamento de código-fonte da Apache Software Foundation (ASF) ao ingressar na incubadora. Ele é projetado especificamente para casos de uso que requerem análises rápidas de dados rápidos. Ele foi projetado para aproveitar as vantagens do hardware de última geração e do processamento na memória. Ele reduz a latência de consulta significativamente para Apache Impala e Apache Spark. Ele distribui os dados por meio do mecanismo de armazenamento colunar ou do particionamento horizontal e, em seguida, replica cada partição usando o consenso Raft, proporcionando baixo tempo médio de recuperação e baixas latências de cauda.
Embora Kudu seja um produto projetado dentro do contexto do ecossistema Apache Hadoop, ele também oferece suporte à integração com outros projetos de analítica de dados dentro e fora do ASF.
O Apache Kudu prova ser eficiente, pois pode processar cargas de trabalho analíticas em tempo real em uma única camada de armazenamento, dando aos arquitetos flexibilidade para lidar com uma variedade maior de casos de uso sem soluções alternativas exóticas.