OpenAI, GPT-4o'yu Tanıttı: Gerçek Zamanlı Çok Modlu Yapay Zeka Etkileşiminde İleriye Doğru Bir Sıçrama
Summary:
OpenAI, ses, görsel ve metin girdilerini gerçek zamanlı olarak işleyebilen ve yanıtlayabilen gelişmiş bir sohbet robotu olan GPT-4o'yu tanıttı. Teknolojinin tanıtımları, kullanıcılara mülakat hazırlığı gibi çeşitli görevlerde yardımcı olmaktan kullanıcıların duygularını tespit etmeye kadar çeşitli yeteneklerini sergiledi. OpenAI'nin önceki yapay zeka araçlarından önemli ölçüde daha iyi performans gösteren modelin, daha doğal insan-bilgisayar etkileşimlerini teşvik etmesi bekleniyor. Kullanıma sunulması 13 Mayıs'ta başladı, metin ve görüntü girişleriyle başladı ve ses ve video girişi güncellemeleri önümüzdeki haftalarda başlatılacak.
ChatGPT'nin yaratıcısı OpenAI, hem işitsel hem de görsel kullanıcı girdilerini gerçek zamanlı olarak analiz edebilen ve bunlara tepki verebilen, daha büyük ölçüde sohbete dayalı ve esrarengiz bir şekilde insan benzeri bir yapay zeka sohbet arkadaşı olan en son yapay zeka teklifi GPT-4o'yu tanıttı. Şirket tarafından sağlanan bir dizi gösteri, GPT-4 Omni'nin potansiyel kullanıcılara görsel olarak bir iş görüşmesine hazırlanmak, iPhone değişimi için müşteri hizmetleriyle iletişime geçmek ve iki kişi arasındaki taş-kağıt-makas oyununu değerlendirmek gibi çeşitli görevlerde yardımcı olduğunu ortaya koyuyor. Yapay zeka sohbet robotunun, bir kullanıcının yavru köpeğine ilk kez tanıtıldığında demolardan birinde sergilendiği gibi, baba şakaları yaptığı, iki dilli konuşmaları gerçek zamanlı olarak çevirdiği ve esprili bir şekilde yanıt verdiği bile gösterildi.
OpenAI, gerçek zamanlı olarak sesli, görsel ve metinsel etkileşim yeteneklerine sahip gelişmiş bir model olan GPT-4o'yu resmi olarak sundu: https://t.co/MYHZB79UqN
API ve ChatGPT'de metin ve görüntü girişlerinin kullanıma sunulması bugün başlıyor ve önümüzdeki haftalarda ses ve video güncellemeleri yapılacak. pic.twitter.com/uuthKZyzYx— OpenAI (@OpenAI) Mayıs 13, 2024
OpenAI'nin CEO'su Sam Altman, 13 Mayıs tarihli bir blog yazısında, "Filmlerde gördüğünüz yapay zekaya benziyor ve gerçekliği beni hala biraz şaşırtıyor" diye itiraf etti. "İnsansı tepki süreleri ve ifade gücü elde etmek oldukça önemli bir kilometre taşıdır." 13 Mayıs'ta, OpenAI'nin yakın tarihli bir X gönderisindeki açıklamasına göre, başlangıçta yalnızca metin ve resim girişi olan bir sürüm piyasaya sürüldü ve tam sürümün önümüzdeki haftalarda piyasaya sürülmesi planlanıyor. Hem ücretsiz hem de ücretli ChatGPT kullanıcıları, ChatGPT'nin API'sinden GPT-4o'ya erişebilecek. GPT-4o'daki "o", "omni" anlamına gelir ve insanlar ile bilgisayarlar arasındaki daha doğal etkileşim modlarına doğru bir sıçramaya işaret eder.
GPT-4o, metin, ses ve görüntü girdilerini aynı anda işleyerek yapay zeka inovasyonunun sınırlarını zorluyor ve bu, OpenAI'nin ChatGPT-4 gibi çoklu görev görevi verildiğinde genellikle masada "önemli miktarda bilgi bırakan" önceki yapay zeka araçlarından bir kilometre taşı iyileştirmesi. OpenAI, kullanıcıların duygularını ve nefes alma kalıplarını tespit etmek de dahil olmak üzere "GPT-4o'nun işitsel ve görsel anlayış açısından önceki modellerden daha iyi performans gösterdiğini" dile getiriyor. Ayrıca OpenAI'nin API'sindeki GPT-4 Turbo'ya kıyasla "önemli ölçüde daha hızlı" ve "%50 daha ucuz". OpenAI, yeni başlatılan AI aracının ses girişlerine 2,3 saniye kadar kısa bir sürede, ortalama 3,2 saniyede yanıt verebildiğini ve günlük bir konuşmadaki tipik insan yanıt sürelerine uyduğunu iddia ediyor.
Published At
5/14/2024 3:32:23 AM
Disclaimer: Algoine does not endorse any content or product on this page. Readers should conduct their own research before taking any actions related to the asset, company, or any information in this article and assume full responsibility for their decisions. This article should not be considered as investment advice. Our news is prepared with AI support.
Do you suspect this content may be misleading, incomplete, or inappropriate in any way, requiring modification or removal?
We appreciate your report.