‘Nenhum humano real iria fazer quatro links profundamente em um labirinto de absurdo gerado pela IA’: o Labyrinth, da Cloudflare, usa páginas de engodo para prender os bots de rastreamento da web e alimentá-los ‘como uma arma defensiva’

A web é atormentada por bots. Isso não é novidade, é claro, mas agora estamos no meio da nossa muito amada revolução da IA (você adora, certo?) Muitos sites são continuamente rastejados por bots com o objetivo de raspá-los de seus preciosos dados para treinar conteúdo de IA. Cloudflare acha que pode ter a solução, no entanto, como seu recém-anunciado Ai Labyrinth A ferramenta pretende levar a luta para os bots nefastos “usando a IA generativa como arma defensiva”.
Cloudflare diz que os rastreadores de IA geram mais de 50 bilhões de solicitações para sua rede todos os dias – e, embora existam ferramentas para bloqueá -los, esses métodos podem alertar os atacantes que foram notados, fazendo com que eles mudem de abordagem (via via A beira).
O AI Labyrinth, no entanto, os links detectaram bots para uma série de páginas geradas pela IA que são convincentes o suficiente para atraí-las, mas não contêm informações úteis.
Por que? Bem, porque eles foram gerados pela IA, é claro. Essencialmente, isso cria um Ouroboros de IA Slop In, AI Slop Out, até o ponto em que o bot desperdiça tempo e recursos preciosos agitando através de conteúdo inútil, em vez de raspar algo criado por um ser humano real.
“Como um benefício adicional, a AI Labyrinth também atua como um honeypot de próxima geração. Nenhum humano real faria quatro links profundamente em um labirinto de absurdo gerado pela IA”, diz Cloudflare.
“Qualquer visitante que faça é muito provável que seja um bot, então isso nos dá uma ferramenta nova para identificar e imprimir bots ruins, que adicionamos à nossa lista de maus atores conhecidos”.
São bots, bots até o fim. O conteúdo “envenenado” gerado pela IA é integrado na forma de links ocultos nas páginas existentes, o que significa que é improvável que um humano as encontre, mas um rastreador da web o fará.
Para dobrar o ângulo humano-primeiro, o Cloudflare também diz que esses links só serão adicionados às páginas visualizadas por suspeitos de raspadores de AI, para que o resto de nós não deve perceber que está trabalhando em segundo plano, combatendo os robôs malignos como algum tipo de cruzado de capas do Batman-Esque.
A ativação da ferramenta é uma questão simples de marcar uma caixa de seleção na página Configurações do CloudFlare, e o Ta-Da, para trabalhar o AI Labyrinth. O Cloudflare diz que esta é apenas a primeira iteração dessa tecnologia em particular e incentiva seus usuários a optar pelo sistema para que possa ser refinado no futuro.
Eu tenho uma pergunta, no entanto. Dado que a IA está agora, vamos ser sinceros, sangrentos em todos os lugares, temos certeza de que piorar seu processo de treinamento não terá efeitos de longo prazo? Far, de mim pegar o lado dos rastreadores nefastos, mas eu me pergunto se isso simplesmente levará a um excesso de modelos de IA ainda mais terríveis no futuro, se seus dados de treinamento estiverem prejudicados desde o início.
Ah, estrague -o, eu me falei do meu próprio argumento. Algo precisa ser feito sobre dados implacáveis sem permissão, raspando o empreendimento humano genuíno, e saudo o pensamento inteligente por trás dessa ferramenta defensiva específica.
Se eu pudesse fazer uma sugestão, no entanto, talvez possamos adicionar um Minotauro? Todos os bons labirintos precisam de um, e então eu posso escrever algo como “Cloudflare pegou o touro pelos chifres e …”
Preencha sua própria manchete lá. Ou, você sabe, pegue uma IA para fazer isso por você. Brincando, brincando. Eu provavelmente não deveria estar alimentando a IA mais de minhas piadas terríveis de qualquer maneira.