O melhor gerador de vídeo da IA (e como eles se comparam)

Com o VEO 2 do Google, os geradores de vídeo da IA estão se tornando cada vez mais aprimorados e mais amplamente disponíveis Agora fui feito Aplicativo Gemini para alguém Google um plano premium da AI. Como o Open Surata, a pista, a mosca de fogo de Adobe e outros, o VO2 permite que você faça um vídeo de aparência profissional que não faz nada além de texto.
Agora, o VEO 2 está disponível para pagar usuários, parece que esses diferentes geradores de vídeo da IA têm uma boa oportunidade de testar um contra o outro, e comparar seus pontos fortes e fracos – e adivinhe onde geralmente estamos com o vídeo da IA. Dizem -nos que essas ferramentas serão Mudar para fazer um filmeOu pelo menos preencher a internet Ai com uma inclinaçãoMas eles são praticamente úteis?
Microsoft se parece, esse é o Usei em um anúncio recente. No entanto, apenas algumas partes do clipe foram feitas na IA–deduções imediatas e tiros limitados de movimento, onde a possibilidade de fraudes é menos provável ou focada.
Para os propósitos deste guia, vou dar uma olhada no Google View 2 e fazer isso contra Surata, pista e Firefly. Outros geradores de vídeo estão disponíveis, mas esses são os quatro mais proeminentes: o valor custa todos eles (começa em US $ 20 por mês), então você precisará se inscrever por pelo menos um mês para jogar com eles.
Bolas de boliche
Se você é tão velho, lembrará de um anúncio incrível que a Sony criou em 2005 (acima) para promover sua nova televisão Bravyia 1080p. Mais de 100.000 bolas de bônus foram jogadas nas ruas íngremes de São Francisco enquanto as câmeras estavam girando, e foi um ótimo relógio (A história por trás da cortina Há muita diversão também).
Este é um verdadeiro desafio para a IA, que inclui muitas físicas e movimentos. O indicador que usei foi: “Milhares de bolas individuais e coloridas estão lentamente pulando em uma rua em pé em São Francisco.
O Google View 2 não é ruim. Há alguma física estranha correndo aqui, mas parece razoavelmente natural e, se você não estiver olhando de perto, pode atuar como um clipe curto. Os elementos de fundo foram bem apresentados e meus indicadores originais foram seguidos de perto.
Surah está confuso sobre a cena que se acredita estar sendo apresentada. Certamente existem bolas coloridas, mas elas se movem como um almíscar confuso e negam a gravidade. A velocidade do vídeo está bem, mesmo que esteja indo na direção oposta de acordo com minha solicitação, e a seção de fundo do vídeo parece completamente boa.
A pista fica muito perto da web, se você a comparar com o clipe original da Sony, mas mais uma vez, muitos problemas são encontrados: as bolas não são permanentes, o movimento não é o que eu pedi e parece olhar para a janela no canto superior direito. Embora a rua pareça muito boa.
O Firefly é provavelmente o pior da bandeira aqui. A maioria das bolas é estacionária e os movimentos não são muito bem apresentados. A rua parece boa, mas isso não é uma coisa especial – definitivamente sente o videogame retrô. Como clipe de Surah, a câmera está me levando na estrada quando eu realmente queria descer.
A cena do “parque Jurassic”
Se a IA está substituindo as pessoas originais, ela precisa criar cenas como o “Welcome of Jurassic Park” no filme de Spelberg em 1993: o momento em que John Hammond, como Richard Atnaburo, revelou seus visitantes ao dinossauro.
Eu estava interessado em ver o que a IA faria essa cena. A dica era: “No topo de uma colina, dois ginecologistas se elevam lentamente para a grama. Quando fazem isso, a câmera retira de volta para um tiro generalizado, que mostra uma ampla clareira e um lago.
O clipe do Google View 2 parece ótimo. A câmera realmente não cresce na maneira como descreve, e os especialistas não ficam realmente surpresos (e nem estão na colina), mas as cenas parecem boas e os dinossauros parecem bem. Isso é comum em geral, mas é um esforço decente.
Surah fica um pouco louco com este gesto. Os movimentos da câmera são desagradáveis e não sigo as instruções que fiz, e os dinossauros parecem uma criatura estranha mudando. Posso dizer que o melhor sobre esse esforço é que os elementos que mencionei estão incluídos e as cenas ao redor foram bem executadas.
No que diz respeito à pista, quando se trata do movimento da câmera e da sensação geral da cena, eu provavelmente queria. Lagos e dinossauros parecem bastante realistas, mas essa não é uma oferta perfeita de alguma maneira, onde os especialistas em camisas vermelhas desaparecem?
Este é outro mau esforço da Firefly. Não tenho certeza se ele sabe o que um especialista é um especialista, e o dinossauro é muito poucos. A floresta do lago e seu ambiente são feitos com um bom padrão, mesmo que, mesmo que haja um brilho notável de IA em tudo no quadro. O movimento da câmera aqui foi bem traduzido.
A cena de “Live Day Light”
Outro: Vista para Cruzamento de Border de Memorial e Cara de Cara A luz do dia de vidaOnde eles arrastam a montanha gelada para baixo na caixa Selo (acima). Não preciso contratar Timetta Dalton ou Mary Dabo, aprender a administrar uma câmera ou viajar para a Áustria, pois a IA pode fazer toda a cena para mim.
A indicação para isso foi: “Um homem e uma mulher em roupas de inverno estão escorregando sob a estrada coberta de neve na edição de Sileo. Há uma barreira na estrada e, quando o alcançam, os dois personagens dão patos abaixo dela”.
O que você acha até agora?
O Google View 2 gerencia muito bem, tudo é considerado. Temos que ignorar as duas pessoas que atravessam os obstáculos da estrada como se não estivesse lá, mas pelo menos há uma barreira (alguns modelos de IA não podem ser entendidos).
Na Surata, e mais uma vez, isso não é terrível. Bem, este não é realmente um caso Selo e, é claro, as duas pessoas enfrentarão a frente, mas a estrada gelada e as árvores circundantes parecem boas. Esta é uma ótima cena. Onde está o meu obstáculo da estrada, Surah? Eu quero ver que essas pessoas estão embaixo disso.
No que diz respeito à pista, quaisquer que fossem treinados os vídeos, eles acreditam que não há vídeos de pessoas que andam nos casos de Celo sob as montanhas. As pessoas estão se misturando, os elementos do tiro estão mudando e parece estranho. Embora as cenas geladas e a neve direta real pareçam boas.
Quem sabe o que a mosca do incêndio da Adobe está pensando aqui. A física não significa nada, os personagens não são permanentes e não há obstáculos ao pato. É irritante ver isso de fato. No entanto, encontramos duas pessoas em uma estrada nevada, estojo de silo e clipe.
Não há vencedor claro
Eu acho que os vídeos do Veo 2 me afetaram mais, embora a pista não pareça mais frequente para o realismo. Em geral, temos muitos problemas com física, realismo e interpretação imediata. Todos esses são vídeos claramente de IA, que têm muitos preços e contradições estranhos.
Agora, eu não esperava que esse gerador de IA chegasse perto de publicidade ou qualidade profissional dos filmes: não é possível fazer essas cenas com apenas um prompt de texto e alguns minutos e esforço. Não estou tentando tirar uma foto barata nessas ferramentas, o que é obviamente inteligente, mas também indica alguns dos problemas básicos com o vídeo da IA.
Essas bolas não estão saltando.
Crédito: Adobe Fire Fly/Life Hacker
Com trabalho e habilidade mais cautelosos, posso encontrar algo que parece muito melhor e, claramente, esses geradores de vídeo vão melhorar com o tempo. Quem sabe o que eles podem produzir em cinco ou 10 anos? Se você verificar os vídeos exibidos nessas plataformas, poderá ver que ótimos resultados são possíveis.
Pessoalmente, porém, não tenho certeza de que essas ferramentas de IA mudem completamente as obras tradicionais do filme, não importa o quão bom seja o treinamento deles. Você terá que escrever um indicador incrivelmente detalhado jantes e jantes, e ainda não encontrará seu próprio costume. A IA pensará no sapo pulando para fora do ralo? Os resultados são rápidos e fáceis, com certeza, mas você está descarregando a IA para decisões criativas. Esses vídeos parecem do computador.

Uma dessas pessoas está prestes a desaparecer.
Crédito: Runway/Life Hacker
A IA realmente não sabe como uma bola salta, ou como o dinossauro se parece, ou como as pessoas devem enfrentar quando escapam na estrada gelada na questão Selo. Ele fecha e calculou com base em todos os vídeos que foram vistos anteriormente, e essas deficiências mostram mais do que imagens ou textos no vídeo. Você verá principalmente vídeos de IA, incluindo os exemplos acima mencionados, não incluem os elementos que entram no tiro e saem, porque é provável que a IA verá como eles se parecem.
E eu nem tenho problemas de direitos autorais ou espaço para atender ao custo da energia no planeta. Não há dúvida de que veremos um número crescente De anúncios feitos pela IA E os shorts melhoram com o tempo, mas vale a pena voltar para Aviso famoso No Jurassic Park: estar sofrendo se podemos fazê -lo, não paramos de pensar se Deve.
Descoberta: Zeif Davis, a empresa principal do Basic Life Hacker, entrou com uma ação contra o Open em abril, alegando que violava a Zef Davis Copyrights em treinamento e administração de seu sistema de IA.