Definição – O que significa Overfitting?
Em estatísticas e aprendizado de máquina, o overfitting ocorre quando um modelo tenta prever uma tendência nos dados que são muito barulhentos. Overfitting é o resultado de um modelo excessivamente complexo com muitos parâmetros. Um modelo com ajuste excessivo é impreciso porque a tendência não reflete a realidade dos dados.
Definirtec explica Overfitting
Um modelo superajustado é um modelo com uma linha de tendência que reflete os erros nos dados com os quais é treinado, em vez de prever com precisão dados não vistos. Isso é melhor visto visualmente com um gráfico de pontos de dados e uma linha de tendência. Um modelo ajustado mostra uma curva com pontos mais altos e mais baixos, enquanto um modelo ajustado mostra uma curva suave ou uma regressão linear.
O principal problema com o overfitting é que o modelo memorizou efetivamente os pontos de dados existentes, em vez de tentar prever quão invisíveis seriam os pontos de dados.
O overfitting normalmente resulta de um número excessivo de pontos de treinamento. Existem várias técnicas que os pesquisadores de aprendizado de máquina podem usar para mitigar o overfitting, incluindo validação cruzada, regularização, parada antecipada, poda, priors Bayesianos, abandono e comparação de modelos.