Definição – o que significam dados sintéticos?
Dados sintéticos são um conceito fundamental em novas tecnologias de dados que fazem uso de dados não autênticos, inventados ou gerados automaticamente que não são gerados por eventos no mundo real.
Ao comparar dados reais e sintéticos, é possível entender mais sobre como funcionam o aprendizado de máquina e outras novas formas de inteligência artificial.
Definirtec explica dados sintéticos
A maneira mais clara de explicar o conceito de dados sintéticos é que dados sintéticos não são dados “reais” criados naturalmente no mundo real, “IRL” ou “no espaço meatspace”, como os profissionais às vezes se referem ao mundo não digital. Os dados sintéticos são criados sem gerar eventos de dados orgânicos reais.
Por exemplo, enquanto um conjunto real de identificadores é coletado sobre um cliente que usa uma plataforma, um engenheiro poderia, em última análise, apenas criar os mesmos identificadores para um cliente fictício e carregá-los no sistema – e isso seria um exemplo de dados sintéticos.
Um melhor entendimento dos dados sintéticos tem a ver com como eles são usados no aprendizado de máquina e tecnologias semelhantes. Em primeiro lugar, os dados sintéticos podem ajudar a dar mais trabalho a um programa de aprendizado de máquina – mas a chave está em como esses dados são gerados, porque, ao contrário dos dados reais, os dados sintéticos têm que ser imaginados e inventados.
Os dados sintéticos também podem ser usados como um honeypot para frustrar os hackers. As empresas podem criar uma grande quantidade de dados sintéticos com identificadores financeiros não autênticos, por exemplo, e colocá-los em um sistema para ver como são alvos de invasores externos. Esse é outro uso comum de dados sintéticos em sistemas de TI.
O uso de dados sintéticos deve ser um grande problema no desenvolvimento de futuros conjuntos de dados de teste e treinamento de tecnologias de aprendizado de máquina, como redes neurais.