Filtro bayesiano – Definirtec

Definição – o que significa filtro bayesiano?

Um filtro Bayesiano é um programa de computador que usa lógica Bayesiana ou análise Bayesiana, que são termos sinônimos. É usado para avaliar o cabeçalho e o conteúdo das mensagens de e-mail e determinar se constitui ou não spam (e-mail não solicitado ou o equivalente eletrônico de cópia impressa em massa ou lixo eletrônico). Um filtro bayesiano é melhor usado junto com programas antivírus.

Definirtec explica o filtro bayesiano

Um filtro Bayesiano trabalha com probabilidades de palavras específicas aparecendo no cabeçalho ou conteúdo de um e-mail. Certas palavras indicam uma alta probabilidade de o e-mail ser spam, como Viagra e refinanciar. O filtro não começa sabendo a probabilidade de uma palavra indicar uma alta probabilidade de spam. Os usuários devem identificar manualmente o e-mail como spam. Quando ocorrências suficientes da palavra são encontradas e o e-mail é identificado como spam, o filtro Bayesiano “aprende” a identificar a palavra usando funções de probabilidade. O mesmo ocorre com muitas outras palavras e frases. Com o tempo, o filtro bayesiano se torna cada vez mais eficaz na identificação de spam para um determinado usuário. Quando a probabilidade atinge um determinado limite, como 95%, o e-mail é identificado como spam e frequentemente movido para uma pasta de lixo eletrônico (ou às vezes até mesmo excluído automaticamente). O usuário pode visualizá-lo periodicamente e decidir se deseja ou não excluí-lo. Como alternativa, alguns programas de spam irão movê-lo para um local de quarentena onde os usuários podem ver o e-mail e revisar a decisão do software.

O “treinamento” inicial pode freqüentemente ser refinado para reduzir falsos positivos ou falsos negativos quando julgamentos errados são encontrados. Isso permite que o filtro bayesiano do software se adapte à natureza em constante evolução do spam.

Alguns filtros de spam também usam heurísticas junto com o filtro Bayesiano. Regras predefinidas são configuradas pelo usuário para aumentar ainda mais a precisão da identificação de e-mail como spam. Essas regras podem envolver o número de ocorrências de uma determinada palavra, eliminar ou ignorar palavras neutras como “o”, “a” ou “algum” ou identificar sequências de obras como “Viagra é bom para”, em oposição à aplicação de uma probabilidade função para todas as quatro palavras individuais.

Os spammers podem usar uma técnica chamada envenenamento Bayesiano para degradar a eficácia dos filtros de spam que usam a filtragem Bayesiana. Algumas técnicas incluem a injeção de texto legítimo de notícias ou fontes literárias, o uso de palavras aleatórias inócuas raramente encontradas em spam ou até a substituição de texto por imagens.

Muitos clientes de e-mail desativam a exibição de imagens por motivos de segurança. Assim, o spam pode atingir menos destinatários.

Um filtro Bayesiano usando lógica Bayesiana pode ser usado para classificar qualquer tipo de dado. Medicina, ciência e engenharia encontraram usos. Curiosamente, pesquisadores científicos especularam que até mesmo o cérebro humano pode usar a metodologia da lógica bayesiana para classificar estímulos e determinar comportamentos de resposta específicos.