O modelo VEO 3 do Google pode criar vídeos com áudio

Como parte do anúncio deste ano em sua conferência de desenvolvedor de E/S, o Google revelou seus mais recentes modelos de criação de veículos. Mais notavelmente, talvez, seja Eu vejo 3É a primeira repetição do modelo que pode criar vídeos com áudio. Por exemplo, ele pode criar um vídeo de pássaros com seu som de canto ou uma estrada da cidade com tráfego em segundo plano. O Google diz que 3 também é superior em física no mundo real e sincronizou os lábios. Atualmente, o modelo está disponível apenas para assinantes da Ultra Gemini nos EUA no aplicativo Gemini e para usuários de negócios no Vertex AI. Também está disponível no Flow, a nova ferramenta de filme da AI do Google.
Fluxo traz, Imagem E Gêmeos juntos para criar clipes e cenas. Os usuários podem descrever a última saída que desejam na linguagem natural e o fluxo funcionará para eles. A nova ferramenta estará disponível apenas para assinantes do Google AI Pro e Ultra nos EUA, mas o Google disse que será lançado em breve para mais países.
Embora a empresa tenha lançado um modelo de criação de vídeo completamente novo, ela ainda não desistiu de 2. Os usuários poderão fornecer 2 imagens de pessoas, cenas, designs e objetos a serem usados como referência para a saída desejada no fluxo. Eles terão acesso aos controles da câmera que lhes permitem girar cenas e aumentar o zoom em objetos específicos para o fluxo. Além disso, eles poderão expandir seus quadros de retratos para paisagens, se quiserem e adicionar ou excluir objetos de seus vídeos.
O Google também introduziu seu mais recente modelo de imagem, Imagen 4, no evento. A empresa disse que a Imagen 4 realizou bons detalhes, como tecidos complexos e pêlos com “clareza notável” e superior na criação de imagens ópticas e abstratas. Também é significativamente melhor na saída de seu antecessor e pode criar imagens em diferentes índices de quadro com uma resolução de até 2k. O Imagen 4 está disponível no aplicativo Gemini, AI Vertex e em aplicativos de espaço de trabalho, incluindo documentos e slides. O Google disse que eles também lançaram o Imagen 4 versão 10 vezes mais rápido que o Imagen 3 “Soon”.
Por fim, para ajudar as pessoas a determinar o conteúdo criado pela IA, cada vez mais difícil, o Google lançou o detector sintid. É um portal em que o usuário pode fazer upload de uma parte do veículo que eles acham que podem ser criados e o Google determinará se ele o contém. SintéticoSuas ferramentas de identificação e formas para a AI Art. O Google abriu sua ferramenta embaçada, mas nem todas as imagens a usam, para que o portal de informações ainda não possa identificar todas as imagens criadas pela IA.