O Google apresenta um modelo teórico de pensamento profundo para Gemini 2.5 Pro e um flash 2.5 melhor

O Google começou a testar um modelo teórico chamado Deep Think para Gemini 2.5 ProA empresa revelou em sua conferência de desenvolvedor de E/S. De acordo com o DeepMind Demis Hassabis CEO, o pensamento profundo de Gemini usa a “mais recente pesquisa avançada” que dá o modelo da capacidade de considerar muitas hipóteses antes de responder às perguntas. O Google disse que eles tiveram uma “pontuação impressionante” quando classificados usando perguntas da Olimpíada Matemática dos EUA em 2025. No entanto, o Google deseja gastar mais tempo para realizar avaliações de segurança e receber a próxima contribuição de especialistas em segurança antes de libertar amplamente. É por isso que disponibiliza o pensamento profundo inicial para testadores confiáveis através da API Gemini primeiro para receber seus comentários primeiro.
A empresa também introduziu um melhor Gemini 2.5 Modelo Flashotimizado para velocidade e eficiência. Agora é mais eficaz do que antes, usando menos códigos de notificação e alcançou pontos mais altos nos benchmarks para teoria, método multimodal, código e contexto longo em comparação com seu antecessor. Geralmente está disponível no início de junho. Atualmente, o Flash 2.5 Flash aprimorado está disponível na forma de visualização via Google AI Studio para desenvolvedores, através da AI da Vertex para clientes empresariais e por meio de aplicativos Gemini para outros usuários.
Embora a maior parte do aumento dos níveis de eficiência mencionada no foco da fase de E/S no Flash 2.5, o Google anunciou que trazer o conceito de flash 2.5 sobre “orçamento de pensamento” para o modelo 2.5 Pro é mais avançado. Esse recurso permitirá que você equilibre os códigos de notificação que gastaram em comparação com a precisão e a velocidade de saída.
Uma maneira separada, o Google está carregando Projeto Mariner Vá para Gemini e AI API. O Project Mariner são revendedores de IA fornecidos pelo Gemini Google que podem navegar por páginas no navegador da web para concluir as tarefas para os usuários. A empresa lançará agentes mais amplos neste verão para que os desenvolvedores possam testá -los. Além disso, a empresa está lançando novas versões de visualização para o texto em discursos nos modelos Flash 2.5 Pro e 2.5 via API Gemini, com suporte para duas vozes em 24 idiomas.