Definição – o que significa Google File System (GFS)?
Google File System (GFS) é um sistema de arquivos distribuído escalonável (DFS) criado pelo Google Inc. e desenvolvido para acomodar os requisitos de processamento de dados em expansão do Google. O GFS fornece tolerância a falhas, confiabilidade, escalabilidade, disponibilidade e desempenho para grandes redes e nós conectados. O GFS é composto de vários sistemas de armazenamento construídos a partir de componentes de hardware de baixo custo. Ele é otimizado para acomodar as diferentes necessidades de uso e armazenamento de dados do Google, como seu mecanismo de busca, que gera grandes quantidades de dados que devem ser armazenados.
O Google File System aproveitou a força dos servidores de prateleira, minimizando as deficiências do hardware.
GFS também é conhecido como GoogleFS.
Definirtec explica o sistema de arquivos do Google (GFS)
O cluster de nó GFS é um único mestre com vários servidores em partes que são continuamente acessados por diferentes sistemas cliente. Os servidores Chunk armazenam dados como arquivos Linux em discos locais. Os dados armazenados são divididos em grandes blocos (64 MB), que são replicados na rede no mínimo três vezes. O grande tamanho do bloco reduz a sobrecarga da rede.
O GFS foi projetado para acomodar os grandes requisitos de cluster do Google sem sobrecarregar os aplicativos. Os arquivos são armazenados em diretórios hierárquicos identificados por nomes de caminhos. Os metadados – como namespace, dados de controle de acesso e informações de mapeamento – são controlados pelo mestre, que interage com e monitora as atualizações de status de cada servidor chunk por meio de mensagens de pulsação cronometrada.
Os recursos GFS incluem:
- Tolerância ao erro
- Replicação de dados críticos
- Recuperação de dados automática e eficiente
- Alta capacidade agregada
- Interação reduzida de cliente e mestre devido ao grande tamanho do servidor
- Gerenciamento e bloqueio de namespace
- Alta disponibilidade
Os maiores clusters GFS têm mais de 1,000 nós com capacidade de armazenamento em disco de 300 TB. Isso pode ser acessado por centenas de clientes continuamente.