Live Chat

Crypto News

Cryptocurrency News 7 months ago
ENTRESRUARPTDEFRZHHIIT

OpenAI apresenta Sora: um modelo revolucionário de texto para vídeo com capacidades impressionantes

Algoine News
Summary:
A OpenAI introduziu um modelo de texto para vídeo, Sora, que pode converter prompts de texto simples em vídeos detalhados de 60 segundos. Utilizando um modelo de "difusão" semelhante ao seu antecessor baseado em imagem DALL-E 3, Sora gera um vídeo inicial ou imagem semelhante a "ruído estático", que refina progressivamente. Apesar de suas capacidades, a OpenAI reconheceu limitações em representar com precisão a física de cenas complexas e entender as relações de causa e efeito. Por enquanto, o acesso ao Sora foi concedido a pesquisadores de segurança cibernética e artistas selecionados para avaliação e feedback. Várias demonstrações das capacidades de Sora circularam online, gerando um interesse considerável.
A OpenAI, uma proeminente instituição de inteligência artificial, acaba de apresentar seu novo modelo de texto para vídeo, Sora, que, apesar das reações iniciais positivas, ainda tem espaço para melhorias. Sora, anunciado pela OpenAI em 15 de fevereiro, aproveita os recursos da IA para transformar prompts de texto simples em vídeos intrincados, melhorar vídeos pré-existentes e até criar cenas a partir de uma imagem estática. Sora é capaz de produzir vídeos de 60 segundos cheios de detalhes ricos, inúmeros personagens exibindo emoções vívidas e movimentos de câmera complexos. Em um post de blog divulgado em 15 de fevereiro, a OpenAI relatou que Sora pode construir sequências semelhantes a uma produção cinematográfica em qualidades de resolução que chegam a 1080p. Semelhante ao modelo anterior centrado na imagem da OpenAI, DALL-E 3, Sora exerce um modelo de "difusão", em que a IA gera um vídeo ou imagem inicial que se assemelha a "ruído estático" e, em seguida, refina-o "erradicando o ruído" progressivamente. De acordo com a OpenAI, o desenvolvimento do Sora foi baseado em aprendizados de seus modelos anteriores, GPT e DALL-E3, o que aparentemente melhorou a precisão do modelo no espelhamento de entradas do usuário. A OpenAI reconheceu as limitações existentes de Sora, como dificuldades em representar corretamente a física de cenas intrincadas e má leitura das relações de causa e efeito. Além disso, Sora pode entender e deturpar as "especificidades espaciais" de um prompt, desalinhando direções ou deixando de aderir a descrições precisas. Por enquanto, a OpenAI tornou Sora acessível apenas a "redteamers", essencialmente pesquisadores de segurança cibernética, para identificar possíveis riscos e problemas, além de alguns designers, artistas visuais e cineastas selecionados para fornecer feedback para melhorias adicionais. Um estudo publicado pela Universidade de Stanford em dezembro de 2023 apontou para os dilemas éticos e legais críticos ligados a modelos de imagem ou vídeo que usam bancos de dados de IA, como o LAION. Sora gerou burburinho no X, com mais de 173 mil postagens discutindo o modelo e circulando demonstrações em vídeo de suas capacidades. O CEO da OpenAI, Sam Altman, demonstrou seu potencial ao gerar vídeos personalizados de acordo com as solicitações dos usuários do X. Vários exemplos incluíram um pato com costas de dragão e golden retrievers hospedando um podcast do topo de uma montanha. Várias pessoas, incluindo o comentarista de IA Mckay Wrigley, expressaram seu espanto com os vídeos produzidos por Sora. Em um post datado de 15 de fevereiro no X, o pesquisador sênior da Nvidia, Jim Fan, afirmou sua crença de que Sora não é simplesmente um brinquedo de IA como o DALL-E 3, mas um "motor de física orientado por dados" mais evoluído, capaz de renderização realista, física intuitiva, raciocínio de horizonte longo e aterramento semântico.

Published At

2/16/2024 8:56:53 AM

Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.

Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal? We appreciate your report.

Report

Fill up form below please

🚀 Algoine is in Public Beta! 🌐 We're working hard to perfect the platform, but please note that unforeseen glitches may arise during the testing stages. Your understanding and patience are appreciated. Explore at your own risk, and thank you for being part of our journey to redefine the Algo-Trading! 💡 #AlgoineBetaLaunch