Google ने Lumiere का अनावरण किया: रीयल-टाइम वीडियो निर्माण के लिए एक क्रांतिकारी AI मॉडल
Summary:
Google शोधकर्ताओं ने Lumiere का अनावरण किया है, जो एक नया प्रसार मॉडल है जो टेक्स्ट या स्थिर छवियों से यथार्थवादी AI वीडियो को तुरंत बना और संशोधित कर सकता है। इस सफलता मॉडल को एआई-वीडियो तकनीक में गेम-चेंजर के रूप में देखा जाता है, जो मौजूदा एआई मॉडल से वीडियो निर्माण के लिए सिंगल-पास दृष्टिकोण के साथ खुद को अलग करता है। 30 मिलियन वीडियो और कैप्शन के डेटासेट पर निर्मित, Lumiere वर्तमान में 16 फ्रेम प्रति सेकंड की गति से 80 फ्रेम का उत्पादन कर सकता है।
Google के वैज्ञानिकों की टीम ने अपने प्रोजेक्ट Lumiere का अनावरण किया है, जो एक उपन्यास प्रसार मॉडल है जो टेक्स्ट या स्टिल इमेज से यथार्थवादी AI वीडियो बना सकता है, जिसमें चलते-फिरते संशोधनों की प्रतिस्पर्धा भी शामिल है। Lumiere अपने "स्पेस-टाइम यू-नेट आर्किटेक्चर" का उपयोग करके "प्रामाणिक, विविध और सुसंगत गति" को चित्रित करने में माहिर है, जिससे यह मॉडल के एक पास के माध्यम से तुरंत एक संपूर्ण वीडियो उत्पन्न कर सकता है। Google ने इस प्रसार मॉडल, Lumiere के साथ AI-वीडियो तकनीक में एक असाधारण प्रगति हासिल की है, जो 2024 को AI वीडियो के लिए एक महत्वपूर्ण वर्ष के रूप में स्थापित करता है।
वैज्ञानिक रिपोर्ट में, शोधकर्ताओं ने विस्तार से बताया कि: "हमारा मॉडल स्थानिक और महत्वपूर्ण, अस्थायी डाउन- और अप-सैंपलिंग को नियोजित करता है और पूर्व-प्रशिक्षित टेक्स्ट-टू-इमेज प्रसार मॉडल पर तुरंत एक पूर्ण-फ्रेम-दर, कम-रिज़ॉल्यूशन वीडियो का उत्पादन करता है, क्योंकि यह कई स्पेस-टाइम स्केल में प्रक्रिया करता है"। इससे पता चलता है कि उपयोगकर्ता अपनी वांछित वीडियो सामग्री का एक शाब्दिक विवरण दर्ज कर सकते हैं या लाइव वीडियो बनाने के लिए एक कमांड के साथ एक स्थिर छवि अपलोड कर सकते हैं। Lumiere की तुलना ChatGPT से की गई है, लेकिन पाठ और छवियों से वीडियो निर्माण, स्टाइलिंग, संपादन और एनीमेशन की अतिरिक्त क्षमताओं के साथ, पेपर सुझाव देता है। वीडियो निर्माण में समय से संबंधित डेटा को संभालने के लिए एकल-पास का उपयोग करने की Google टीम की अनूठी विधि Lumiere को मौजूदा AI वीडियो जनरेटर जैसे Pika और Runway से अलग करती है। संबंधित: एआई डीपफेक ने अमेरिकी 2024 चुनावों से पहले नागरिकों और राजनेताओं को धोखा दिया - 'मुझे विश्वास था कि यह वास्तविक था' Lumiere की क्षमताओं का एक नमूना प्रदर्शन X पर एक छात्र शोधकर्ता हिला चेफर द्वारा साझा किया गया था, जिन्होंने Google के साथ मॉडल विकास में सहयोग किया था।
Lumiere को उनके वर्णनात्मक कैप्शन के साथ 30 मिलियन वीडियो के डेटासेट के आधार पर विकसित किया गया था; हालाँकि, वीडियो डेटा स्रोत, AI और कॉपीराइट कानून के दायरे में एक विवादास्पद मुद्दा, अभी तक संदर्भित नहीं किया गया है। वर्तमान में, मॉडल 16 फ्रेम प्रति सेकंड की गति से 80 फ्रेम का उत्पादन करने में सक्षम है। एक्स पर उपयोगकर्ताओं ने Google की उपलब्धि को "उत्कृष्ट", "अत्याधुनिक" के रूप में सराहा है, और वे आगामी वर्ष में वीडियो निर्माण में महत्वपूर्ण वृद्धि की उम्मीद कर रहे हैं।
पत्रिका: क्रिप्टो + एआई टोकन का चयन, एजीआई के लिए आवश्यक दशक, गैलेक्सी एआई का 100 एम फोन तक विस्तार: एआई आई।
Published At
1/25/2024 5:00:00 PM
Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.
Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal?
We appreciate your report.