Definição – O que significa K-Nearest Neighbor (K-NN)?
Um algoritmo k-vizinho mais próximo, muitas vezes abreviado k-nn, é uma abordagem para classificação de dados que estima a probabilidade de um ponto de dados ser membro de um grupo ou de outro, dependendo de qual grupo os pontos de dados mais próximos a ele estão .
O k-vizinho mais próximo é um exemplo de algoritmo de “aprendizado preguiçoso”, o que significa que ele não constrói um modelo usando o conjunto de treinamento até que uma consulta ao conjunto de dados seja realizada.
Definirtec explica o vizinho mais próximo de K (K-NN)
Um k-vizinho mais próximo é um algoritmo de classificação de dados que tenta determinar em qual grupo um ponto de dados está olhando para os pontos de dados ao seu redor.
Um algoritmo, olhando para um ponto em uma grade, tentando determinar se um ponto está no grupo A ou B, observa os estados dos pontos que estão próximos a ele. O intervalo é determinado arbitrariamente, mas o objetivo é obter uma amostra dos dados. Se a maioria dos pontos estiver no grupo A, é provável que o ponto de dados em questão seja A em vez de B e vice-versa.
O k-vizinho mais próximo é um exemplo de algoritmo de “aprendizado preguiçoso” porque não gera um modelo do conjunto de dados de antemão. Os únicos cálculos que ele faz são quando é solicitado a pesquisar os vizinhos do ponto de dados. Isso torna o k-nn muito fácil de implementar para mineração de dados.