Definição – o que significa Spider Trap?
Uma armadilha de aranha é um recurso online que intercepta um rastreador da web ou bot em um loop infinito ou outra situação recursiva que consome seus recursos e essencialmente amarra esse rastreador para um conjunto específico de iterações.
Uma armadilha de aranha também é conhecida como armadilha de rastreamento.
Definirtec explica Spider Trap
Algumas armadilhas para aranhas são feitas para desviar intencionalmente a atenção dos rastreadores da web. Por exemplo, alguém pode programar uma estrutura de diretório profunda para que o rastreador da web vá se arrastando para dentro dessa estrutura, em vez de se mover para outras áreas de um site ou espaço online. Os programadores também podem sobrecarregar o analisador léxico do rastreador ou carregar uma sessão com cookies para drenar os recursos de spambots ou outros rastreadores.
Outras armadilhas de aranha são feitas involuntariamente por meio de erros de programação. Alguns tipos de referências de calendário podem causar loops aparentemente infinitos e travar rastreadores mal feitos.
O uso de armadilhas de aranha e outros projetos para frustrar os rastreadores robóticos da web vai mudar com o surgimento de novos princípios de aprendizado de máquina e inteligência artificial. Uma vez que os designers provaram que agora podem fazer rastreadores da web que podem responder a comandos na página da mesma forma que os humanos, recursos como o CAPTCHA não serão mais eficazes contra usuários robóticos. Armadilhas de aranha e armadilhas de rastreador provavelmente não irão, porque as partes que usam os rastreadores ou bots irão investi-los na habilidade de reconhecer essas armadilhas e evitá-las.