Modelo de IA da OpenAI Transforma Texto em Vídeo com Alta Qualidade
Sora Turbo permite criar vídeos em 1080p a partir de texto, revolucionando a produção audiovisual com inteligência artificial
A OpenAI, conhecida por suas inovações em inteligência artificial e apoiada pela gigante Microsoft, apresentou mais uma novidade disruptiva. Trata-se de um modelo de IA de texto para vídeo chamado Sora, que já está disponível para usuários do ChatGPT Plus e Pro. Essa tecnologia promete transformar o modo como conteúdos audiovisuais são criados, competindo com ferramentas similares desenvolvidas por empresas como Meta e Alphabet.
Disponibilidade e Funcionalidades do Sora Turbo
Lançado inicialmente em fevereiro de forma restrita, o modelo agora é acessível como Sora Turbo sem custos adicionais para assinantes dos planos avançados do ChatGPT. A OpenAI revelou que vídeos podem ser criados com as seguintes especificações:
- Resolução: Até 1080p, garantindo qualidade Full HD.
- Duração: Vídeos de até 20 segundos.
- Proporções: Formatos widescreen, vertical e quadrado, atendendo a diferentes necessidades, desde redes sociais até apresentações corporativas.
Além disso, a OpenAI anunciou planos de expandir o acesso ao Sora para todas as regiões onde o ChatGPT está disponível, prometendo maior disponibilidade conforme aperfeiçoa medidas contra o uso indevido, como a geração de deepfakes.
Um Olhar no Futuro: Preços Personalizados e Expansão de Recursos
A empresa revelou que está trabalhando em modelos de preços personalizados, previstos para o início do próximo ano. Essa abordagem visa atender diferentes perfis de usuários, desde criadores de conteúdo amadores até empresas que buscam soluções profissionais.
Para mitigar riscos, como a manipulação mal-intencionada de vídeos, a OpenAI implementou limitações iniciais nos uploads. A expectativa é expandir gradualmente os recursos com base no aprimoramento de medidas de segurança.
Startup de Ex-Pesquisador da OpenAI Investe em IA de Áudio
Enquanto a OpenAI avança no campo audiovisual, um ex-pesquisador da empresa, Alexis Conneau, está liderando um movimento no setor de inteligência artificial de áudio. Sua startup, WaveForms AI, levantou US$ 40 milhões em financiamento inicial, com suporte de investidores como Andreessen Horowitz, alcançando uma avaliação de US$ 200 milhões.
A WaveForms AI tem como objetivo criar modelos de IA que conectem emocionalmente os humanos e as máquinas por meio da voz. Segundo Conneau, o áudio é fundamental para transmitir emoções e proporcionar uma interação mais natural entre humanos e bots.
Inovação e Controvérsias
Conneau foi um dos responsáveis pelo desenvolvimento do modo de voz no GPT-4o, modelo lançado pela OpenAI no início deste ano. Esse recurso foi elogiado por permitir respostas em tempo real e lidar com interrupções de maneira fluida, simulando conversas humanas de forma quase indistinguível.
No entanto, o lançamento gerou polêmica após a atriz Scarlett Johansson acusar a OpenAI de copiar sua voz do filme Ela (2013). A empresa negou a acusação, afirmando ter utilizado outra atriz de voz para o modelo. O episódio destacou os desafios éticos e legais na criação de tecnologias de voz que imitam emoções humanas.
Foco no Futuro da Interação Humano-Máquina
A startup WaveForms AI visa revolucionar as interações por voz, desenvolvendo sistemas que priorizam a qualidade emocional. Conneau enfatiza que a maior parte das empresas está focada em superinteligências, enquanto sua startup busca criar experiências mais imersivas e agradáveis com IA.
Com a evolução dessas tecnologias, tanto no campo de vídeo quanto no de áudio, o horizonte das interações humano-máquina se torna cada vez mais promissor.