Definição – o que significa o conjunto de testes?
Um conjunto de teste no aprendizado de máquina é um conjunto de dados secundário (ou terciário) que é usado para testar um programa de aprendizado de máquina depois que ele foi treinado em um conjunto de dados de treinamento inicial. A ideia é que os modelos preditivos sempre têm algum tipo de capacidade desconhecida que precisa ser testada, ao invés de analisada de uma perspectiva de programação.
Um conjunto de teste também é conhecido como conjunto de dados de teste ou dados de teste.
Definirtec explica o conjunto de testes
Muitos especialistas diriam que a melhor prática é ter um conjunto de dados de teste que seja “sequestrado” ou mantido até o final do processo. Os engenheiros buscam ajustes excessivos do modelo e outras questões no processo de treinamento. Idealmente, há um terceiro conjunto, um conjunto de dados de validação, que testa os parâmetros do classificador. Então, e somente então, o conjunto de testes pode ser trazido para ver quão bem o programa foi treinado e se seu modelo preditivo é preciso em novos dados. Embora alguns modelos possam evitar a criação de um conjunto de teste particionado, isso costuma ser visto como míope, porque a falta de testes práticos pode deixar um programa sujeito à imprecisão.