Definição – O que significa Análise de Componente Principal (PCA)?
A análise de componentes principais (PCA) é uma técnica usada para identificação de um número menor de variáveis não correlacionadas conhecidas como componentes principais de um conjunto maior de dados. A técnica é amplamente usada para enfatizar a variação e capturar padrões fortes em um conjunto de dados. Inventada por Karl Pearson em 1901, a análise de componentes principais é uma ferramenta usada em modelos preditivos e análise exploratória de dados. A análise de componentes principais é considerada um método estatístico útil e usado em campos como compressão de imagens, reconhecimento facial, neurociência e computação gráfica.
Definirtec explica a análise de componentes principais (PCA)
A análise do componente principal ajuda a tornar os dados mais fáceis de explorar e visualizar. É uma técnica simples não paramétrica para extrair informações de conjuntos de dados complexos e confusos. A análise de componentes principais concentra-se na quantidade máxima de variância com o menor número de componentes principais. Uma das vantagens distintas associadas à análise do componente principal é que, uma vez que os padrões são encontrados nos dados em questão, a compactação de dados também é suportada. Faz-se uso da análise de componentes principais para eliminar o número de variáveis ou quando há muitos preditores em relação ao número de observações ou para evitar a multicolinearidade. Ele está intimamente relacionado à análise correlacional canônica e faz uso da transformação ortogonal para converter o conjunto de observações contendo variáveis correlacionadas em um conjunto de valores conhecido como componentes principais. O número de componentes principais usados na análise de componentes principais é menor ou igual ao menor número de observações. A análise de componentes principais é sensível à escala relativa das variáveis originalmente usadas.
A análise de componentes principais é amplamente usada em muitas áreas, como pesquisa de mercado, ciências sociais e em indústrias onde grandes conjuntos de dados são usados. A técnica também pode ajudar a fornecer uma imagem em dimensões inferiores dos dados originais. Apenas um esforço mínimo é necessário no caso de análise de componente principal para reduzir um conjunto de dados complexo e confuso em um conjunto de informações úteis simplificado.