As pessoas são a localização reversa das fotos no chat gpt, e realmente funciona

Essa semana, Openi anunciou seus últimos modelos: O3 e O4-mini. Estes são Modelos de raciocínioQue quebra os indicadores em várias partes, que são abordadas ao mesmo tempo. O objetivo é “pensar” por uma solicitação mais profunda do que outros modelos e atingir os resultados mais profundos e precisos.
Embora existam muitas funções em potencial para o modelo de raciocínio “mais poderoso” do Openi, um uso que está soprando levemente nas mídias sociais é para geometria – apenas para identificar o que você pode ver em uma imagem. Como relatou Tech CrunchOs usuários do X estão postando sobre suas experiências que estão pedindo à O3 para identificar locais a partir de imagens aleatórias e mostrar resultados brilhantes. A bota adivinhará onde no mundo pensa que a imagem foi tirada e quebrará suas razões para pensar. Por exemplo, pode -se dizer que se tornou zero em uma placa de coloração específica que identifica um país específico ou que viu um idioma específico ou estilo escrito em um símbolo.
De acordo com alguns desses usuários, o Chattagpat não está usando nenhum metadado oculto nas imagens para ajudar a identificar seus lugares: alguns estão removendo esses dados das fotos antes de compartilhar com o modelo do testador; portanto, teoricamente, ele está apenas trabalhando no raciocínio e na pesquisa da web.
Por um lado, é uma tarefa divertida colocar o bate -papo GPT no GPT. A geoscing on -line é toda a raiva, portanto, tornar este exercício mais acessível pode ser uma coisa boa. Por outro lado, existem implicações óbvias para a privacidade e a segurança: uma pessoa com acesso ao modelo O3 do Chatgupat pode usar o modelo de argumento para indicar onde se vive ou é baseado em outra imagem anônima.
Decidi examinar os recursos geográficos da O3 com alguns aços do Google Street View, para descobrir se o hype da Internet acabou. A boa notícia é que, por minha própria experiência, está longe de ser uma ótima ferramenta. Na verdade, não parece muito melhor do que um modelos abertos de Openi, Como 4o.
Para testar as habilidades geográficas de O3
A O3 pode lidar com marcas claras com relativamente facilidade: experimentei uma vista de uma estrada em Minnesota, que enfrentou o horizonte dos Manipolis na vanguarda. Demorou apenas um minuto e seis segundos para identificar a cidade, e soube que estávamos assistindo I-35W. Também apontou imediatamente Panthaun em Paris, observando que a captura de tela era desde a reforma em 2015 (eu não sabia quando a apresentei!)
Crédito: Hacker de vida
Em seguida, eu queria experimentar marcas e lugares não famosos. Encontrei uma esquina aleatória em Springfield de Illinois, que apresenta a principal igreja batista da cidade. Isso acontece quando as coisas começam a ficar interessantes: O3 esmagou a imagem em várias partes, procurando indicar recursos em cada um. Como este é um modelo razoável, você pode ver o que está procurando em algumas culturas. Como outras vezes eu experimentei modelos de raciocínio, é estranho ver a bota “pensando” com interferência mútua como os humanos. ۔ Dependendo de onde a inicialização está em processo de pensamento, ela pode começar a pesquisar mais informações e você pode clicar nesses links para investigar o que está se referindo.
Apesar de todo esse argumento, a localização perseguiu a bota e não conseguiu concluir a análise. Após três minutos e 47 segundos, inicialize Parecia ser Ao se aproximar dele, dizendo: “A localização da 400 E Jackson Street, em Springfield, pode estar perto da Igreja da Catedral de Il St. Paul. Minha colheita não pegou todo o quadro, então preciso ajustar o coordenado e verificar com uma cor branca, com uma cor branca.
O que você acha até agora?

Crédito: Hacker de vida
A bota identificou corretamente a estrada, mas de maneira mais impressionante, a cidade. Também fiquei impressionado com a análise da igreja. Embora ele estivesse lutando para identificar uma igreja em particular, ele foi capaz de analisar seu estilo, o que poderia levá -lo no caminho certo. No entanto, a análise foi rapidamente separada. O próximo “pensamento” foi sobre como estar localizado no campo da primavera, Missouri ou Kansas City. É a primeira vez que vi algo sobre o Missouri, o que me surpreendeu a surpreender se a bota Intriga Entre os dois campos de primavera. A partir daqui, a bota perdeu a trama, imaginando se a igreja estava no meio de ou pode ser a mansão do governador (que realmente não se parece com uma igreja).
Antes que essa análise seja completamente interrompida, as especulações sobre outros lugares continuaram especulando sobre outros lugares. Com a experiência subsequente, testei uma cidade aleatória em Kansas: após três minutos de pensamento, a bota pensou que minha foto era de Filton, Illinois – porém, até sua reputação, tinha certeza de que a foto era de algum lugar no Centro -Oeste. Pedi a ele para tentar novamente e, antes de interromper a análise para o bem, ele pensou em avaliar diferentes cidades em diferentes estados.
Não é mais a hora do medo
O problema é que parece no GPT -4o que, quando se trata de identidade do local, ele também está no O3. Foi imediatamente capaz de indicar que o horizonte dos manipolis e imediatamente. Estima -se que a foto do Kansas estava na verdade em Iowa. (É claro. Estava errado, mas foi rápido sobre isso.) Parece que os becos com as experiências de outras pessoas com os modelos: o Tech Crunch O3 conseguiu identificar O3, que não conseguiu identificar 4O, mas os modelos eram igualmente semelhantes.
Embora existam certamente algumas preocupações de privacidade e segurança com a IA, não acho que a O3 precise ser coletada como uma ameaça específica. Ele pode ser usado para avaliar corretamente onde uma imagem foi tirada, é claro, mas pode facilmente comê -la – ou completamente travada. Como 4o vale a mesma precisão, eu diria que hoje é tanta preocupação quanto no ano passado ou mais. Não é Muito legalMas isso não é sério. Economizo o pânico para um modelo de IA que o recupera sempre, especialmente quando a imagem não é clara.
Em conexão com as preocupações de privacidade e segurança, o Openi compartilhou o seguinte com a crise de tecnologia: “Open IO 3 e O-4-Mini-Chat trazem argumentos visuais ao GPT, o que o torna acessível, pesquisando ou respostas de emergência aos pedidos para identificar os pedidos de seus pedidos para buscar mais informações de seus modelos. Trabalharem para treinar.