Definição – o que significa validação cruzada?
A validação cruzada é uma técnica usada para avaliar como os resultados da análise estatística se generalizam para um conjunto de dados independente. A validação cruzada é amplamente usada em configurações onde o destino é a previsão e é necessário estimar a precisão do desempenho de um modelo preditivo. A principal razão para o uso da validação cruzada em vez da validação convencional é que não há dados suficientes disponíveis para particioná-los em conjuntos separados de treinamento e teste (como na validação convencional). Isso resulta em uma perda de capacidade de teste e modelagem.
A validação cruzada também é conhecida como estimativa de rotação.
Definirtec explica a validação cruzada
Para um problema de predição, um modelo geralmente é fornecido com um conjunto de dados conhecidos, chamado de conjunto de dados de treinamento, e um conjunto de dados desconhecidos contra os quais o modelo é testado, conhecido como conjunto de dados de teste. O objetivo é ter um conjunto de dados para testar o modelo na fase de treinamento e, em seguida, fornecer uma visão sobre como o modelo específico se adapta a um conjunto de dados independente. Uma rodada de validação cruzada compreende o particionamento de dados em subconjuntos complementares e, em seguida, a realização de análises em um subconjunto. Depois disso, a análise é validada em outros subconjuntos (conjuntos de teste). Para reduzir a variabilidade, muitas rodadas de validação cruzada são realizadas usando muitas partições diferentes e, em seguida, uma média dos resultados é obtida. A validação cruzada é uma técnica poderosa na estimativa da técnica de desempenho do modelo.