Live Chat

Crypto News

Cryptocurrency News 7 months ago
ENTRESRUARPTDEFRZHHIIT

تقدم OpenAI Sora: نموذج ثوري لتحويل النص إلى فيديو بقدرات رائعة

Algoine News
Summary:
قدمت OpenAI نموذجا لتحويل النص إلى فيديو ، Sora ، يمكنه تحويل المطالبات النصية البسيطة إلى مقاطع فيديو مفصلة مدتها 60 ثانية. باستخدام نموذج "الانتشار" المشابه لسابقه القائم على الصور DALL-E 3 ، يقوم Sora بإنشاء فيديو أو صورة أولية تشبه "الضوضاء الثابتة" ، والتي تقوم بتحسينها تدريجيا. على الرغم من قدراته ، أقر OpenAI بالقيود في تمثيل فيزياء المشاهد المعقدة بدقة وفهم علاقات السبب والنتيجة. في الوقت الحالي ، تم منح الوصول إلى Sora للباحثين في مجال الأمن السيبراني والفنانين المختارين للتقييم والتعليقات. تم تداول العديد من العروض التوضيحية لقدرات سورا على الإنترنت ، مما أثار اهتماما كبيرا.
قدمت OpenAI ، وهي مؤسسة ذكاء اصطناعي بارزة ، نموذجها الجديد لتحويل النص إلى فيديو ، Sora ، والذي ، على الرغم من ردود الفعل الأولية الإيجابية ، لا يزال لديه مجال للتحسينات. Sora ، الذي أعلنته OpenAI في 15 فبراير ، يسخر قدرات الذكاء الاصطناعي لتحويل مطالبات النص العادي إلى مقاطع فيديو معقدة ، وتحسين مقاطع الفيديو الموجودة مسبقا ، وحتى صياغة مشاهد من صورة ثابتة. Sora قادر على إنتاج مقاطع فيديو مدتها 60 ثانية مليئة بالتفاصيل الغنية ، والعديد من الشخصيات التي تظهر مشاعر حية ، وحركات الكاميرا المعقدة. في منشور مدونة صدر في 15 فبراير ، ذكرت OpenAI أن Sora يمكنها بناء تسلسلات أقرب إلى الإنتاج السينمائي في صفات الدقة التي تصل إلى 1080 بكسل. على غرار نموذج OpenAI السابق المرتكز على الصور ، DALL-E 3 ، يمارس Sora نموذج "الانتشار" ، حيث يولد الذكاء الاصطناعي مقطع فيديو أو صورة أولية تشبه "الضوضاء الثابتة" ، ثم يصقلها عن طريق "القضاء على الضوضاء" تدريجيا. وفقا ل OpenAI ، استند تطوير Sora إلى التعلم من نماذجهم السابقة ، GPT و DALL-E3 ، والتي عززت ظاهريا دقة النموذج في عكس مدخلات المستخدم. اعترف OpenAI بالقيود الحالية لسورا ، مثل الصعوبات في تمثيل فيزياء المشاهد المعقدة بشكل صحيح وسوء قراءة علاقات السبب والنتيجة. علاوة على ذلك ، قد يسيء سورا فهم وتحريف "التفاصيل المكانية" للموجه ، وبالتالي يسيء محاذاة الاتجاهات أو يفشل في الالتزام بالأوصاف الدقيقة. في الوقت الحالي ، جعلت OpenAI Sora متاحة فقط ل "أعضاء الفريق الأحمر" ، وهم في الأساس باحثون في مجال الأمن السيبراني ، لتحديد المخاطر والقضايا المحتملة ، بالإضافة إلى بعض المصممين المختارين والفنانين المرئيين وصانعي الأفلام لتقديم ملاحظات لمزيد من التحسينات. أشارت دراسة نشرتها جامعة ستانفورد في ديسمبر 2023 إلى المعضلات الأخلاقية والقانونية الحرجة المرتبطة بنماذج صناعة الصور أو الفيديو التي تستخدم قواعد بيانات الذكاء الاصطناعي مثل LAION. أثار سورا ضجة على X ، مع أكثر من 173000 مشاركة تناقش النموذج وتوزع عروض فيديو لقدراته. أظهر الرئيس التنفيذي لشركة OpenAI Sam Altman إمكاناتها من خلال إنشاء مقاطع فيديو مخصصة وفقا لطلبات مستخدمي X. تضمنت الأمثلة المختلفة بطة مدعومة بالتنين والمستردون الذهبيون يستضيفون بودكاست من أعلى جبل. أعرب العديد من الأفراد ، بمن فيهم المعلق الذكاء الاصطناعي مكاي ريجلي ، عن رهبتهم من مقاطع الفيديو التي أنتجها سورا. في منشور بتاريخ 15 فبراير على X ، أكد كبير الباحثين في Nvidia ، Jim Fan ، اعتقاده بأن Sora ليست مجرد لعبة الذكاء الاصطناعي مثل DALL-E 3 ولكنها "محرك فيزياء قائم على البيانات" أكثر تطورا قادرا على العرض الواقعي والفيزياء البديهية والتفكير الأفقي الطويل والتأريض الدلالي.

Published At

2/16/2024 8:56:53 AM

Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.

Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal? We appreciate your report.

Report

Fill up form below please

🚀 Algoine is in Public Beta! 🌐 We're working hard to perfect the platform, but please note that unforeseen glitches may arise during the testing stages. Your understanding and patience are appreciated. Explore at your own risk, and thank you for being part of our journey to redefine the Algo-Trading! 💡 #AlgoineBetaLaunch