Disputa de dados

Definição – o que significa organização de dados?

Data wrangling é um tipo específico de gerenciamento de dados que surge de novos recursos de software que apresentam conjuntos de dados grandes, confusos e diversos que precisam entrar em uma arquitetura orientada a serviços (SOA) para fins de análise e uso. A transformação de dados geralmente envolve muitas técnicas sofisticadas diferentes para lidar com dados irregulares ou diversos e manipulá-los para casos de uso de negócios.

Definirtec explica Data Wrangling

Pode soar como um termo informal, mas a disputa de dados realmente ocupa um espaço particular no gerenciamento de dados. Uma maneira útil de entender a disputa de dados é contrastá-la com a metodologia frequentemente mais formal de extração, transformação e carregamento (ETL). A transformação de dados tem aspectos e casos de uso diferentes do ETL. Muitas vezes, é feito por cientistas de dados qualificados ou outras pessoas próximas ao pipeline. De certa forma, a transformação de dados pode ser chamada de um tipo de ETL de “código aberto” em que os engenheiros que lidam com os dados podem ser mais “práticos” ou usar métodos de extração mais manuais.

Para aqueles que realmente entendem os processos refinados pelos quais diversos dados são selecionados, classificados e alimentados em arquiteturas corporativas, a preparação de dados é, na verdade, um tópico muito importante. Os profissionais de TI analisam uma vasta gama de ferramentas, recursos e técnicas para agregar valor a dados confusos, brutos ou não estruturados.