बाल शोषण सामग्री की खोज के बाद एलआईओएन ने एआई डेटा सेट वापस ले लिया
Summary:
स्टैनफोर्ड के शोधकर्ताओं द्वारा संदिग्ध बाल शोषण सामग्री की खोज के बाद जर्मन गैर-लाभकारी संगठन एलएआईओएन से लोकप्रिय कृत्रिम बुद्धिमत्ता डेटा सेट एलएआईओएन -5 बी और एलएआईओएन -400 एम को वापस ले लिया गया है। हालांकि ऐसी सामग्री जरूरी नहीं कि एआई मॉडल आउटपुट को काफी प्रभावित करती है, लेकिन इसका प्रभाव पड़ सकता है, खासकर अगर दोहराया जाता है। LAION अवैध सामग्री के खिलाफ सख्त उपायों का वादा करता है और संगठनों के साथ काम करता है ताकि उनके डेटासेट में लिंक सुरक्षा की जांच और सुनिश्चित किया जा सके। डेटा सेट सुरक्षा सुनिश्चित करने के लिए, LAION ने विवादास्पद डेटा सेट को पुनर्प्रकाशित होने से पहले हटा दिया है।
आमतौर पर स्टेबल डिफ्यूजन और इमेजन जैसे मॉडल को शिक्षित करने के लिए नियोजित एक लोकप्रिय कृत्रिम बुद्धिमत्ता डेटा सेट को इसके प्रदाता द्वारा वापस ले लिया गया है। यह एक शोध के बाद आता है जिसमें बाल शोषण सामग्री के कई संदिग्ध उदाहरणों की उपस्थिति का पता चला है। इस डेटा सेट के लिए जिम्मेदार संगठन, एलआईओएन - बड़े पैमाने पर आर्टिफिशियल इंटेलिजेंस ओपन नेटवर्क, जर्मनी से एक गैर-लाभकारी संगठन है जो टेक्स्ट-टू-इमेज अनुप्रयोगों की मेजबानी के लिए ओपन-सोर्स एआई मॉडल और प्रशिक्षण सेट का योगदान देता है।
स्टैनफोर्ड इंटरनेट ऑब्जर्वेटरी के साइबर पॉलिसी सेंटर के शोधकर्ताओं ने 20 दिसंबर को एक रिपोर्ट प्रकाशित की जिसमें कहा गया है कि उन्होंने एलएआईओएन -5 बी डेटा सेट के भीतर संदिग्ध बाल शोषण सामग्री के 3,226 उदाहरणों का खुलासा किया है। साइबर पॉलिसी सेंटर के बिग डेटा आर्किटेक्ट और चीफ टेक्नोलॉजिस्ट डेविड थिएल के अनुसार, तीसरे पक्ष ने इस सामग्री के एक महत्वपूर्ण हिस्से को सत्यापित किया है। थिएल ने यह भी कहा कि इस तरह की सामग्री के अस्तित्व का मतलब यह नहीं है कि यह डेटा सेट पर प्रशिक्षित मॉडल के परिणामों को काफी हद तक संशोधित करेगा; हालांकि, यह संभावित रूप से कुछ प्रभाव डाल सकता है। उन्होंने कहा कि अलग-अलग पीड़ितों की छवियों के सुदृढीकरण के कारण समान शोषण सामग्री की पुनरावृत्ति विशेष रूप से समस्याग्रस्त हो सकती है।
एलआईओएन ने मार्च 2022 में एलआईओएन -5 बी डेटासेट पेश किया, जिसमें 5.85 बिलियन इमेज-टेक्स्ट जोड़े शामिल थे। संगठन अवैध सामग्री के खिलाफ सख्त नीति बनाए रखता है और एलआईओएन डेटासेट में हाइपरलिंक की सुरक्षा की जांच और पुष्टि करने के लिए इंटरनेट वॉच फाउंडेशन जैसी संस्थाओं के साथ साझेदारी करता है। इन लिंक को उनके समुदाय और संबद्ध संगठनों द्वारा स्थापित फ़िल्टरिंग टूल की मदद से मान्य किया जाता है।
एलएआईओएन ने चेतावनी देते हुए घोषणा की है कि उसने संदिग्ध डेटा सेट ों को हटा दिया है, जिसमें एलएआईओएन -5 बी और एलएआईओएन -400 एम दोनों शामिल हैं। यह कदम डेटा सेट की सुरक्षा सुनिश्चित करने के लिए उठाया गया था, इससे पहले कि उन्हें फिर से उपयोग के लिए उपलब्ध कराया जाए।
Published At
12/21/2023 9:45:55 AM
Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.
Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal?
We appreciate your report.