Definição – o que significa filtragem heurística?
A filtragem heurística se refere ao uso de vários algoritmos e recursos para examinar texto ou conteúdo de maneiras específicas. A palavra heurística descreve um tipo de análise que se baseia na experiência ou em critérios intuitivos específicos, em vez de métricas técnicas simples. O uso de algoritmos de alto nível permite a análise heurística de conteúdo, em que humanos podem programar computadores para pensar de certas maneiras, em vez de apenas aplicar uma análise puramente quantitativa.
A filtragem heurística é mais amplamente usada na Internet para filtrar e-mail e acesso à Web.
Definirtec explica a filtragem heurística
Um tipo comum de filtragem heurística é chamada de filtragem Bayesiana. Isso é comumente aplicado à filtragem de spam de e-mail. A filtragem bayesiana ajuda um computador a reconhecer certas palavras e a probabilidade de que estejam relacionadas a spam. Em geral, técnicas como essa envolvem treinar a máquina para aplicar uma análise de conteúdo de alto nível a fim de filtrar o spam.
Qualquer pessoa que tenha um serviço de e-mail público com uma pasta de spam provavelmente já viu algum tipo de filtragem heurística de spam em funcionamento. Como o spam continua a ser um grande desafio na comunicação por e-mail, os especialistas em tecnologia estão tentando encontrar maneiras mais diversas de identificar o spam. As alternativas à filtragem heurística de spam incluem listas negras de IP e filtragem de URL, que usam endereços IP e outras informações em vez de tentar identificar spam por meio de análise de conteúdo. Os críticos da filtragem heurística de spam argumentam que um filtro baseado na associação de palavras nem sempre é totalmente eficaz na separação de spam de e-mail legítimo.