कॉपीराइट मुकदमों के बीच Sora मॉडल के डेटा मूल पर OpenAI प्रमुख की अस्पष्टता
Summary:
OpenAI के CTO, मीरा मुराती ने फर्म के आगामी AI मॉडल, सोरा के प्रशिक्षण में उपयोग किए गए डेटा की उत्पत्ति के बारे में अनिश्चितता दिखाई है। द वॉल स्ट्रीट जर्नल के साथ एक साक्षात्कार में, उसने कहा कि सार्वजनिक रूप से उपलब्ध और लाइसेंस प्राप्त डेटा का उपयोग किया गया था, लेकिन इस बात की पुष्टि नहीं कर सकता कि सोशल मीडिया प्लेटफॉर्म से डेटा शामिल किया गया था या नहीं। उसने सोरा के प्रशिक्षण के लिए शटरस्टॉक डेटा के उपयोग की पुष्टि की। OpenAI को अपने AI मॉडल के प्रशिक्षण डेटा के कारण कई कानूनी कार्रवाइयों का सामना करना पड़ा है, लेखकों और द न्यूयॉर्क टाइम्स ने आरोप लगाया है कि उनकी कॉपीराइट सामग्री का उपयोग बिना सहमति के किया गया है।
OpenAI की मुख्य प्रौद्योगिकी अधिकारी, मीरा मुराती ने फर्म के जल्द ही लॉन्च होने वाले वीडियो जनरेटिंग AI मॉडल, सोरा को प्रशिक्षित करने के लिए उपयोग किए जाने वाले डेटा की उत्पत्ति के बारे में अनिश्चितता प्रदर्शित की है। 13 मार्च को हुई द वॉल स्ट्रीट जर्नल के साथ एक चर्चा के दौरान, सोरा के लिए डेटा उत्पत्ति के बारे में स्पष्टता, लिखित निर्देशों से वीडियो बनाने के लिए डिज़ाइन किया गया एक मॉडल, मुराती द्वारा प्रदान नहीं किया गया था। डेटा की नींव के बारे में प्रश्नों के लिए मुराती की प्रतिक्रिया यह थी कि यह सार्वजनिक संसाधनों और लाइसेंस प्राप्त डेटा से प्राप्त किया गया था। इस तरह 80 अरब डॉलर वैल्यूएशन वाली एक फर्म अपना आगामी मॉडल तैयार कर रही थी। द जर्नल की जोआना स्टर्न ने पूछताछ की कि क्या सोरा के लिए प्रशिक्षण डेटा यूट्यूब, इंस्टाग्राम या फेसबुक जैसे सोशल मीडिया प्लेटफॉर्म से लिया गया था, जिस पर मुराती ने जवाब दिया कि वह अनिश्चित थी। स्टर्न ने तब स्टॉक इमेज फर्म शटरस्टॉक के साथ ओपनएआई के सहयोग का संदर्भ दिया, और सोचा कि क्या उनका डेटा सोरा के प्रशिक्षण में नियोजित किया गया था। इसके लिए, मुराती विशिष्ट डेटा उपयोग पर विस्तार से पीछे हट गए, लेकिन दोहराया कि यह सार्वजनिक या लाइसेंस प्राप्त स्रोतों से उत्पन्न हुआ है। बाद में उसने जर्नल को पुष्टि की कि शटरस्टॉक डेटा वास्तव में सोरा के लिए उपयोग किया गया था।
एआई मॉडल को रुझानों को पहचानने, पूर्वानुमान बनाने या बड़ी मात्रा में डेटा के माध्यम से भाषा को समझने के लिए सिखाया जाता है जिसे प्रशिक्षण डेटा सेट के रूप में जाना जाता है। 2018 में OpenAI में शामिल होने के बाद से, मुराती ने फर्म की कई सफल परियोजनाओं में केंद्रीय भूमिका निभाई है, जिसमें DALL-E 3, एक छवि-जनरेटिंग मॉडल, भाषण पहचान उपकरण व्हिस्पर और उनके चैटबॉट का नवीनतम संस्करण, GPT-4 शामिल है। सैम ऑल्टमैन को OpenAI के बोर्ड द्वारा बर्खास्त किए जाने के बाद उन्होंने नवंबर 2023 में अस्थायी CEO की भूमिका ग्रहण की।
OpenAI के AI मॉडल के प्रशिक्षण डेटा से जुड़ी कानूनी कार्यवाही कंपनी के खिलाफ शुरू की गई है। जुलाई 2023 में, OpenAI पर लेखकों सारा सिल्वरमैन, रिचर्ड काड्रे और क्रिस्टोफर गोल्डन द्वारा मुकदमा दायर किया गया था क्योंकि उन्होंने दावा किया था कि ChatGPT इन लेखकों द्वारा कॉपीराइट सामग्री का सारांश तैयार करता है। इसी तरह का मुकदमा दिसंबर में द न्यूयॉर्क टाइम्स द्वारा Microsoft और OpenAI के खिलाफ दायर किया गया था, जिसमें कॉपीराइट उल्लंघन का आरोप लगाया गया था क्योंकि कंपनियों ने अपने AI चैटबॉट्स के प्रशिक्षण में अखबार की सामग्री का उपयोग किया था। कैलिफ़ोर्निया में एक अलग क्लास-एक्शन मुकदमा OpenAI पर ChatGPT को प्रशिक्षित करने के लिए उपयोगकर्ता की सहमति प्राप्त किए बिना इंटरनेट से निजी उपयोगकर्ता डेटा निकालने का आरोप लगाता है।
Published At
3/16/2024 11:47:13 PM
Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.
Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal?
We appreciate your report.