Claude não é um ótimo jogador de Pokemon, e isso é bom

se Claude interpreta Pokemon É suposto dar um vislumbre do futuro da inteligência artificial, não é uma oferta muito convincente. Durante o mês passado e contagem Pokémon vermelho. Em várias corridas, Claude não conseguiu superar o jogo de aproximadamente 30 anos. Até agora para David Hershey, o principal desenvolvedor do projeto, a oferta foi bem -sucedida.

“Eu queria um lugar onde eu pudesse entender como Claude lidava com as situações em que ele precisa trabalhar por um período muito longo”, explica para mim Hershey sobre uma videochamada. Como parte de sua função diária em humanos, Hershey trabalha na equipe para ir ao mercado onde os clientes da empresa ajudam a criar seus próprios agentes (mais sobre isso em um momento). O trabalho começou pela primeira vez em Claude jogando Pokemon como um projeto paralelo em breve 3.5 Sonata Em junho passado.

Você também pode adivinhar o nome, o projeto foi parcialmente inspirado Nashl toca PokemonQue apareceu pela primeira vez em 2014 e testemunhou 1,16 milhão de postagens na tentativa de persistir Pokémon vermelho Usando os espectadores das entradas escritas apenas na caixa de transmissão. Hershey não foi o primeiro funcionário de Angrovies a tentar formular Claude no campeão da Liga Pokemon, mas o projeto levou sua própria vida perto da participação.

Nos primeiros dias do projeto, foi ótimo quando Claude conseguiu deixar a casa de Red e encontrar o professor OK. “Passei algumas horas malignas em adulterar para fazê -lo alcançar esse tipo de progresso”, diz Hershey. Ele costumava atualizar seus colegas em Claude no canal de recessão interna. Nesse ponto, a maior parte da empresa não estava interessada e não estava planejada para compartilhar com o mundo.

No entanto, a Hershey tornou habitual reconsiderar o projeto a cada emissão de novos modelos principais de antropologia Claude 3.5 Sonata no outono passado E novamente recentemente com 3.7 Sonnet. “É assim que vou ver”, o que é esse novo modelo? “Como?” “O que posso aprender sobre isso?”

Dentro do antrop, a esperança era que Claude se tornasse melhor em tentar estratégias diferentes e ajustar sua abordagem quando as coisas não foram de acordo com o plano. com Pokémon vermelho, A empresa viu Claude fazer essas coisas em um tempo real. “(Claude 3,7 sonetos) passa menos tempo nas suposições”, diz Hershey. “Você ainda verá que ele está adivinhando, então passa várias horas na crença de que isso é verdade e toma decisões estúpidas nesse meio tempo, mas os modelos anteriores continuarão a fazê -lo para sempre”.

Um esquema mostra o progresso na reprodução do Pokémon vermelho.
Antropic

Literalmente, você pode ver Claude desenvolvendo e executando essas suposições. Cada passo lento no jogo precede um parágrafo do texto da inteligência artificial – “Eu enfrentei bebidas selvagens enquanto me mudava para (24,24). De acordo com minha estratégia, devo escapar dessa batalha para a preservação de recursos” – seguida de um botão de impressão. Então ele recupera a condição do jogo e o faz novamente.

Se você está assistindo Claude, você está enrugado Pokémon vermelho Como fã de jogo, um modelo parece estar “menos preso em suposições”, especialmente quando o chatbot frequentemente tropeça em áreas como florestas veridianas e, às vezes, por vários dias, devido ao design do nível do projeto. No entanto, é um sinal proeminente do tipo de sistema de inteligência artificial representado por Claude 3.7.

Como muitos sistemas de IA de fronteira modernos, o Claude 3,7 soneto é um modelo de lógica, o que significa que ele foi projetado para resolver problemas, dividindo -os em pedaços menores. “Muitos de nossos clientes estão interessados ​​na eficácia de Claude”, explica Hershey. Para iniciantes, Agentes da AIS ou agente da AIS Eles são sistemas projetados para planejar e realizar tarefas complexas sem supervisão humana. Atualmente, a maioria das pessoas pensa na inteligência artificial como uma caixa de bate -papo vazia, aguardando a resposta para uma pergunta, mas as lutas são apenas a face do consumidor da indústria; Os agentes são um passo gradual, mas importante em direção à promessa de inteligência geral artificial.

Nessa perspectiva, há algumas coisas que fazem Claude tocar Pokemon é interessante. Primeiro, há um fato incrível, a Hershey delegou muita programação que tornou o projeto possível Agente de codificação de Anthropier Incluindo uma sobrecarga que permite que Claude entenda Pokemon Reed Mundo do jogo.

Segundo, e o mais importante, Claude não foi pré -tocado Pokémon vermelho. Chatbot sabe alguns dos princípios básicos sobre o jogo, como o nome de cada capitão da academia e o sistema que o jogador deve superar, mas ele não tem centenas de anos de conhecimento do jogo como alguns Sistemas especializados de inteligência artificial. “Você pode jogar um modelo em um jogo sem preparação, sem instruções e pode aprender tudo em si”, diz ele. “Pretendo ser o mais próximo desse aspecto.”

Hershey teve que dar ajuda a Claude. Eu já mencionei até que ponto lhe permite explicar Pokemon Reed Interface. A arte do pixel é algo que luta contra todos os sistemas de inteligência artificial, e 3.7 Sonite não espera. Como seres humanos, nossa imaginação faz um ótimo trabalho ao preencher os detalhes que você sugeriu alguns pixels. Além do mais, não vê “Claude do jeito que fazemos.

Se você vir isso de perto, notará toda vez que ele mover a personalidade do jogador, ele fará alguns insumos antes de avaliar seu site. Entre esses pneus, Claude não é nenhuma entrada sensorial. A caminhada vermelha não pode ser vista, nem “ele ouve” quando suas entradas causam uma árvore ou outro obstáculo. A “visão fraca” Claude é uma das principais razões pelas quais luta com o jogo; Na verdade, Hershey teve que dar a Chatbot uma maneira de ler a memória do jogo, então é provável que ele o vincule se a interpretação da tela fosse ofendida.

Se o objetivo do projeto é Claude para superar Pokémon vermelhoFoi fácil. A Hershey poderia ter sido programada através do jogo para seguir o Chatbot, mas, neste momento, tudo o que teria testado era a qualidade de Claude para um sólido conjunto de instruções. “Claude é muito bom nisso”, diz Hershey. “Eu sabia. Todos nós sabíamos disso.”

Em vez disso, ao deixar Claude por seus próprios dispositivos, o novo modelo mostrou que é melhor planejar, alcançar novas estratégias e, eventualmente, tentar algo diferente quando suas suposições estão erradas. Um dos mais Novas soluções Claude evoluiu durante sua terceira corrida durante o jogo foi deliberadamente fazer com Pokémon desmaiar para que ele pudesse escapar do Monte Moon.

No entanto, Claude pode ser muito melhor no planejamento de curto e longo prazo. No mesmo exemplo, ela acabou de mencionar, Claude excluiu todas as suas observações sobre o Monte Moon depois de respirar no centro de Bokimon, nas proximidades, acreditando incorretamente que ela conseguiu se mover na caverna. Uma de suas corridas promissoras terminou depois que Claude não admitiu que precisava falar com Bill para avançar no jogo. Eu tropecei em um episódio sem fim de tomar más decisões.

“Avançando, não sei o quão útil é internamente como padrão. É possível que, com um pequeno grupo de pequenas habilidades, Claude fique um pouco melhor e o jogo seja apreendido, e então o padrão não é interessante”, admite Hershey. “Pode ser que haja coisas que eu não entendo completamente sobre o que tornará nosso próximo modelo um bom e então continuaremos aprendendo muitas coisas adicionais ao longo do caminho”.

Quanto ao que acontece depois disso, Hershey diz que não tem uma estratégia de longo prazo para interpretar Claude Pokemon. “Passei muito tempo – minha esposa dirá muito tempo – olhando para isso”, diz rindo. Eu também sinto que a Hershey não está pronta para fechar o livro no projeto. “Gostaria de imaginar sempre que um novo modelo aparecer, tocarei Pokemon com ele e mostrarei ao mundo isso também”.

Até então, Anthropor continua, após uma recente redefinição, na transmissão de Claude Pokemon toca em Nashil. O projeto foi bem -sucedido o suficiente para inspirar um desenvolvedor independente para o programa A. Gêmeos interpreta Pokemon Assista, e se eu tiver que adivinhar, veremos mais imitadores antes de muito tempo.

Este artigo foi originalmente apareceu no Engadget em https://www.engadget.com/ai/claude-isnt-a- gleet-pokemon-player-and-athat-okay-151522448.html? Src = rss?

Source link

Artigos Relacionados

Botão Voltar ao Topo