Definição – o que significa Extract Transform Load (ETL)?
Extract transform load (ETL) é o processo de extração, transformação e carregamento durante o uso do banco de dados, mas particularmente durante o uso do armazenamento de dados. Inclui os seguintes subprocessos:
- Recuperando dados de fontes externas de armazenamento ou transmissão de dados
- Transformar dados em um formato compreensível, onde os dados são normalmente armazenados junto com uma detecção de erro e código de correção para atender às necessidades operacionais
- Transmitindo e carregando dados para a extremidade receptora
Definirtec explica Extract Transform Load (ETL)
A primeira fase de um processo ETL se concentra na recuperação dos dados da fonte de armazenamento. A maioria dos projetos de armazenamento de dados integra dados recebidos de vários sistemas de origem. Cada sistema individual pode empregar uma organização ou formato de dados separado. Estruturas de fonte de dados comuns são bancos de dados relacionais e arquivos de dados puros. Eles também podem incluir padrões de banco de dados não relacionais, como sistemas de gerenciamento de informações ou outras estruturas de dados, como método de acesso de armazenamento virtual (VSAM) ou método de acesso sequencial indexado (ISAM). As fontes de dados podem até incluir fontes externas, como dados provenientes da Internet ou por meio de um sistema de digitalização.
A fase de transformação usa uma série de regras ou operações para recuperar dados puros da origem para entregar os dados em sua forma final para manipulação na extremidade receptora. Algumas fontes de dados precisam de muito pouco ou nenhum processamento de dados. Às vezes, uma ou mais transformações podem ser críticas para corresponder aos requisitos de negócios e técnicos do banco de dados de destino.
O estágio de carregamento ou transmissão visa enviar dados para a extremidade receptora, que provavelmente será o armazenamento de dados. De acordo com as necessidades da aplicação, este processo pode ser muito simples ou muito complicado. Alguns métodos de armazenamento de dados podem substituir dados antigos por dados cumulativos. A atualização dos dados extraídos normalmente é feita periodicamente.