Definição – o que significa dados não rotulados?
Dados não rotulados é uma designação para pedaços de dados que não foram identificados com rótulos que identificam características, propriedades ou classificações. Os dados não rotulados são normalmente usados em várias formas de aprendizado de máquina.
Definirtec explica dados não rotulados
Em tipos de aprendizado de máquina chamados aprendizado de máquina não supervisionado, o programa de aprendizado de máquina opera avaliando conjuntos de dados não rotulados. Como os dados não têm rótulos, o programa de aprendizado de máquina precisa identificar cada dado em suas propriedades e características.
Uma das melhores maneiras de explicar isso é usando a metáfora da fruteira. Suponha que o programa de aprendizado de máquina esteja aprendendo a identificar três tipos diferentes de frutas – bananas, uvas e maçãs. Se os dados no conjunto de treinamento inicial estiverem rotulados, o programa de aprendizado de máquina funcionará a partir dessa perspectiva – combinando imagens sucessivas a uma dessas três categorias.
Se, no entanto, nenhuma das partes de dados estiver rotulada com os três nomes de frutas – bananas, uvas e maçãs – o programa de aprendizado de máquina precisará funcionar avaliando cada imagem e observando características como cor – amarelo, vermelho ou roxo – formas – longo e fino, redondo ou agrupado – e outras características.
A partir deste exemplo, é fácil ver como os dados rotulados oferecem oportunidades muito mais fáceis de usar algoritmos de aprendizado de máquina para resultados de decisão. No entanto, programas sofisticados de aprendizado de máquina não supervisionados que lidam com dados não rotulados podem produzir resultados incrivelmente precisos e também.