Definição – O que significa DataStage Parallel Extender (DataStage PX)?
DataStage Parallel Extender (DataStage PX) é uma ferramenta de integração de dados IBM. É uma entre as muitas ferramentas de extração, transformação e carregamento (ETL) amplamente utilizadas no setor de armazenamento de dados. Essa ferramenta pode coletar informações de fontes heterogêneas, realizar transformações de acordo com as necessidades do negócio e carregar os dados nos respectivos data warehouses.
O DataStage PX também pode ser chamado de DataStage Enterprise Edition.
Definirtec explica DataStage Parallel Extender (DataStage PX)
O DataStage Parallel Extender possui uma arquitetura paralela para processar dados. Os dois principais tipos de paralelismo implementados no DataStage PX são pipeline e paralelismo de partição. A capacidade de processar dados em paralelo acelera o processamento de dados em grande medida.
O DataStage Parallel Extender incorpora uma variedade de estágios por meio dos quais os dados de origem são processados e reforçados nos bancos de dados de destino. Eles são definidos em termos de terabytes. Além dos estágios, o DataStage PX usa contêineres para reutilizar os componentes e sequências do trabalho para executar e agendar vários trabalhos ao mesmo tempo.
Os estágios comumente usados no DataStage Parallel Extender incluem:
- transformador
- Agregador
- Conjunto de dados
- Copiar
- Mudança aplicável
- modificar
- filtros
- Regista-te em
- ir
- Olho para cima