Modelo de IA da OpenAI Transforma Texto em Vídeo com Alta Qualidade

Sora Turbo permite criar vídeos em 1080p a partir de texto, revolucionando a produção audiovisual com inteligência artificial

A OpenAI, conhecida por suas inovações em inteligência artificial e apoiada pela gigante Microsoft, apresentou mais uma novidade disruptiva. Trata-se de um modelo de IA de texto para vídeo chamado Sora, que já está disponível para usuários do ChatGPT Plus e Pro. Essa tecnologia promete transformar o modo como conteúdos audiovisuais são criados, competindo com ferramentas similares desenvolvidas por empresas como Meta e Alphabet.

Sora Turbo: A IA revolucionária da OpenAI que transforma texto em vídeos impressionantes de alta qualidade.
Sora Turbo: A IA revolucionária da OpenAI que transforma texto em vídeos impressionantes de alta qualidade.

Disponibilidade e Funcionalidades do Sora Turbo

Lançado inicialmente em fevereiro de forma restrita, o modelo agora é acessível como Sora Turbo sem custos adicionais para assinantes dos planos avançados do ChatGPT. A OpenAI revelou que vídeos podem ser criados com as seguintes especificações:

  • Resolução: Até 1080p, garantindo qualidade Full HD.
  • Duração: Vídeos de até 20 segundos.
  • Proporções: Formatos widescreen, vertical e quadrado, atendendo a diferentes necessidades, desde redes sociais até apresentações corporativas.

Além disso, a OpenAI anunciou planos de expandir o acesso ao Sora para todas as regiões onde o ChatGPT está disponível, prometendo maior disponibilidade conforme aperfeiçoa medidas contra o uso indevido, como a geração de deepfakes.

Um Olhar no Futuro: Preços Personalizados e Expansão de Recursos

A empresa revelou que está trabalhando em modelos de preços personalizados, previstos para o início do próximo ano. Essa abordagem visa atender diferentes perfis de usuários, desde criadores de conteúdo amadores até empresas que buscam soluções profissionais.

Para mitigar riscos, como a manipulação mal-intencionada de vídeos, a OpenAI implementou limitações iniciais nos uploads. A expectativa é expandir gradualmente os recursos com base no aprimoramento de medidas de segurança.


Startup de Ex-Pesquisador da OpenAI Investe em IA de Áudio

Enquanto a OpenAI avança no campo audiovisual, um ex-pesquisador da empresa, Alexis Conneau, está liderando um movimento no setor de inteligência artificial de áudio. Sua startup, WaveForms AI, levantou US$ 40 milhões em financiamento inicial, com suporte de investidores como Andreessen Horowitz, alcançando uma avaliação de US$ 200 milhões.

A WaveForms AI tem como objetivo criar modelos de IA que conectem emocionalmente os humanos e as máquinas por meio da voz. Segundo Conneau, o áudio é fundamental para transmitir emoções e proporcionar uma interação mais natural entre humanos e bots.

Inovação e Controvérsias

Conneau foi um dos responsáveis pelo desenvolvimento do modo de voz no GPT-4o, modelo lançado pela OpenAI no início deste ano. Esse recurso foi elogiado por permitir respostas em tempo real e lidar com interrupções de maneira fluida, simulando conversas humanas de forma quase indistinguível.

No entanto, o lançamento gerou polêmica após a atriz Scarlett Johansson acusar a OpenAI de copiar sua voz do filme Ela (2013). A empresa negou a acusação, afirmando ter utilizado outra atriz de voz para o modelo. O episódio destacou os desafios éticos e legais na criação de tecnologias de voz que imitam emoções humanas.


Foco no Futuro da Interação Humano-Máquina

A startup WaveForms AI visa revolucionar as interações por voz, desenvolvendo sistemas que priorizam a qualidade emocional. Conneau enfatiza que a maior parte das empresas está focada em superinteligências, enquanto sua startup busca criar experiências mais imersivas e agradáveis com IA.

Com a evolução dessas tecnologias, tanto no campo de vídeo quanto no de áudio, o horizonte das interações humano-máquina se torna cada vez mais promissor.

Rafael Gouveia

Especialista em SEO, Wordpress e Marketing Digital, Rafael tem 38 anos e é um apaixonado por tecnologia, computadores, videogames e chopp gelado. É o fundador e principal redator do Media Manager, além de atuar como programador, analista e gerente de mídias sociais. Rafael também escreve e compartilha dicas no blog RG Games, que leva o seu nome, e possui alguns canais no YouTube. Nos finais de semana, ele solta a voz como cantor. Além disso, é pai da pequena Maju.

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.