Live Chat

Crypto News

Cryptocurrency News 6 months ago
ENTRESRUARPTDEFRZHHIIT

L’ambiguïté du chef d’OpenAI sur l’origine des données du modèle Sora au milieu des poursuites pour droits d’auteur

Algoine News
Summary:
La directrice technique d’OpenAI, Mira Murati, a fait preuve d’incertitude quant à l’origine des données utilisées dans l’entraînement du prochain modèle d’IA de l’entreprise, Sora. Dans une interview accordée au Wall Street Journal, elle a déclaré que des données accessibles au public et sous licence avaient été utilisées, mais n’a pas pu confirmer si les données des plateformes de médias sociaux étaient incluses. Elle a confirmé l’utilisation des données de Shutterstock pour l’entraînement de Sora. OpenAI a fait l’objet de multiples actions en justice en raison des données d’entraînement de ses modèles d’IA, les auteurs et le New York Times alléguant que leur contenu protégé par le droit d’auteur a été utilisé sans consentement.
La directrice de la technologie d’OpenAI, Mira Murati, a fait preuve d’incertitude quant à l’origine des données utilisées pour former le modèle d’IA générant des vidéos de l’entreprise, Sora, qui sera bientôt lancé. Lors d’une discussion avec le Wall Street Journal qui a eu lieu le 13 mars, Murati n’a pas fourni de clarté sur l’origine des données de Sora, un modèle conçu pour produire des vidéos à partir d’instructions écrites. La réponse de Murati aux questions sur le fondement des données a été qu’elles avaient été obtenues à partir de ressources publiques et de données sous licence. C’est ainsi qu’une entreprise dont la valorisation est de 80 milliards de dollars préparait son prochain modèle. Joanna Stern, du Journal, a demandé si les données d’entraînement de Sora provenaient de plateformes de médias sociaux comme YouTube, Instagram ou Facebook, ce à quoi Murati a répondu qu’elle n’en était pas sûre. Stern a ensuite fait référence à la collaboration d’OpenAI avec Shutterstock, la société d’images d’archives, et s’est demandé si leurs données avaient été utilisées dans la formation de Sora. À cela, Murati s’est abstenu de donner des détails sur l’utilisation spécifique des données, mais a réitéré qu’elles provenaient de sources publiques ou sous licence. Elle a confirmé plus tard au Journal que les données de Shutterstock avaient bien été utilisées pour Sora. Les modèles d’IA apprennent à reconnaître les tendances, à faire des prévisions ou à comprendre le langage via de grandes quantités de données appelées ensembles de données d’entraînement. Depuis qu’il a rejoint OpenAI en 2018, Murati a joué un rôle central dans plusieurs projets réussis de l’entreprise, notamment DALL-E 3, un modèle de génération d’images, l’instrument de reconnaissance vocale Whisper et la version la plus récente de leur chatbot, GPT-4. Elle a brièvement assumé le rôle de PDG temporaire en novembre 2023 après le licenciement de Sam Altman par le conseil d’administration d’OpenAI. Des poursuites judiciaires concernant les données d’entraînement des modèles d’IA d’OpenAI ont été engagées contre l’entreprise. En juillet 2023, OpenAI a été poursuivi en justice par les auteurs Sarah Silverman, Richard Kadrey et Christopher Golden, qui affirmaient que ChatGPT générait des résumés de matériel protégé par le droit d’auteur de ces auteurs. Une action en justice similaire a été intentée en décembre par le New York Times contre Microsoft et OpenAI, alléguant une violation du droit d’auteur car les entreprises ont utilisé le contenu du journal dans la formation de leurs chatbots d’IA. Un recours collectif distinct en Californie accuse OpenAI d’avoir extrait des données privées d’utilisateurs d’Internet sans obtenir le consentement de l’utilisateur pour entraîner ChatGPT.

Published At

3/16/2024 11:47:13 PM

Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.

Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal? We appreciate your report.

Report

Fill up form below please

🚀 Algoine is in Public Beta! 🌐 We're working hard to perfect the platform, but please note that unforeseen glitches may arise during the testing stages. Your understanding and patience are appreciated. Explore at your own risk, and thank you for being part of our journey to redefine the Algo-Trading! 💡 #AlgoineBetaLaunch