मेटा ने सामग्री संपादन और पीढ़ी में क्रांति लाने के लिए एआई-संचालित एमू मॉडल का अनावरण किया
Summary:
इंटरनेट दिग्गज मेटा ने दो नए आर्टिफिशियल इंटेलिजेंस मॉडल, एमू वीडियो और एमू एडिट का अनावरण किया है, जिसका उद्देश्य सामग्री निर्माण और संपादन को बढ़ाना है। एमू वीडियो टेक्स्ट और इमेज इनपुट से वीडियो क्लिप उत्पन्न करता है, जबकि एमू एडिट बेहतर परिशुद्धता के साथ छवियों में हेरफेर करता है। ये मॉडल अभी भी शोध के दौर से गुजर रहे हैं, लेकिन संभावित रूप से रचनाकारों, कलाकारों और एनिमेटरों के लिए महत्वपूर्ण लाभ पेश करते हैं। कड़े नियामक जांच के कारण इन उपकरणों की रिलीज और तैनाती सावधानीपूर्वक की जा रही है।
हाल ही में एक ब्लॉग पोस्ट में, मेटा, इंटरनेट विशालकाय, ने दो अभिनव कृत्रिम बुद्धिमत्ता मॉडल का अनावरण किया, जिसका उद्देश्य सामग्री उत्पादन और संपादन को बढ़ाना है। एमू वीडियो का कार्य मेटा के पिछले एमू मॉडल पर निर्माण करते हुए टेक्स्ट और इमेज इनपुट से वीडियो क्लिप का निर्माण करना है। दूसरी ओर, एमू एडिट, बढ़ी हुई सटीकता के साथ छवियों में हेरफेर करता है। हालांकि ये मॉडल अभी भी शोध के दौर से गुजर रहे हैं, मेटा रचनाकारों, कलाकारों और एनिमेटरों को उनके लिए व्यवहार्य अनुप्रयोग खोजने की कल्पना करता है।
मेटा ने एमू वीडियो के प्रशिक्षण के लिए अपने "कारक" दृष्टिकोण का खुलासा किया, मॉडल को विभिन्न इनपुट के लिए लचीला बनाने के लिए प्रक्रिया को दो चरणों में विभाजित किया। पहले चरण में टेक्स्ट प्रॉम्प्ट के आधार पर छवियां बनाना शामिल है, जबकि दूसरा चरण पिछली छवि और पाठ दोनों का उपयोग करके एक वीडियो का उत्पादन करता है। यह विधि वीडियो पीढ़ी मॉडल के प्रभावी प्रशिक्षण को सक्षम बनाती है।
विशेष रूप से, एमू वीडियो मॉडल में छवियों को जीवन में लाने की क्षमता है। मॉडल के एक जटिल कैस्केड को नियोजित करने के बजाय, यह 512x512, 16 फ्रेम प्रति सेकंड के साथ चार-सेकंड वीडियो बनाने के लिए बस दो प्रसार मॉडल का उपयोग करता है। एमू एडिट छवि हेरफेर में सटीकता पर केंद्रित है, जिससे रंग और ज्यामिति परिवर्तन, पृष्ठभूमि को जोड़ने और हटाने के साथ-साथ स्थानीय और वैश्विक स्तर पर संपादन जैसे परिवर्तनों की अनुमति मिलती है।
ऐसा करने में, मेटा का उद्देश्य यह सुनिश्चित करना है कि मॉडल केवल संपादन अनुरोध के लिए प्रासंगिक पिक्सेल को बदल देता है और कुछ भी नहीं। उदाहरण के लिए, जब पाठ "अलोहा!" को बेसबॉल कैप में जोड़ा जाता है, तो मॉडल को वास्तविक टोपी को नहीं बदलना चाहिए।
एमू एडिट को प्रशिक्षित करने के लिए, मेटा ने 10 मिलियन संश्लेषित छवियों का उपयोग किया, प्रत्येक एक इनपुट छवि और वांछित परिणाम के साथ एक कार्य के अनुरूप। मेटा के अनुसार, यह उपलब्ध अपनी तरह का सबसे बड़ा डेटासेट है। इसके अलावा, मेटा ने नए जारी किए गए एमू मॉडल को प्रशिक्षित करने के लिए फेसबुक और इंस्टाग्राम से उपयोगकर्ता-साझा की गई तस्वीरों और कैप्शन सहित 1.1 बिलियन डेटा एकत्र किए।
हालांकि, दुनिया भर के नियामकों से गहन जांच के कारण मेटा के एआई टूल की तैनाती सावधानीपूर्वक की गई है। मेटा ने हाल ही में घोषणा की कि उसके एआई टूल का उपयोग राजनीतिक अभियानों और विज्ञापनदाताओं द्वारा फेसबुक और इंस्टाग्राम पर विज्ञापन बनाने के लिए नहीं किया जा सकता है।
Published At
11/16/2023 8:00:00 PM
Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.
Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal?
We appreciate your report.