Proof News tarafından yapılan bir araştırma Apple, NVIDIA, Anthropic ve Salesforce gibi bazı büyük teknoloji şirketlerinin yapay zeka modellerini YouTube altyazılarını içeren bir veri kümesi kullanarak eğittiğini ortaya çıkartmıştı.
Kar amacı gütmeyen EleutherAI tarafından hazırlanan “YouTube Altyazıları” adlı veri kümesi, yüz milyonlarca abonesi olan Mr. Beast gibi popüler içerik oluşturucular da dahil olmak üzere 170 binden fazla kanaldan altyazı içeriyordu. Teknoloji şirketlerinin verilerden kâr elde etmeye çalıştığı yönünde iddialar vardı ve tartışmalar tabii ki Apple’ın bu veri setini kullanan OpenELM modellerine de sıçradı.
Apple tarafından 9to5Mac‘e yapılan açıklamada, OpenELM modelinin Apple Intelligence’da veya diğer yapay zeka/makine öğrenimi özelliklerinde kullanılmadığını doğruladı. Başka bir deyişle YouTube altyazı veritabanı, Apple Intelligence özelliklerini desteklemiyor.
OpenELM, bu yılın başlarında piyasaya sürülen bir açık kaynaklı model ailesi. Şirket, OpenELM’i “son teknoloji ürünü bir açık dil modeli” olarak tanımlıyor ve bunun “açık araştırma topluluğunu güçlendirmek ve güçlendirmek, gelecekteki açık araştırma çabalarının önünü açmak” için yayınlandığını söylüyor.
Şirket daha önce Apple Intelligence modellerini eğitmek için “temel modellerimizi eğitirken kullanıcıların özel kişisel verilerini veya kullanıcı etkileşimlerini” kullanmadığını açıklamıştı.
Yine de şirket, temel modellerini belirli özellikleri geliştirmek için seçilen verilerin yanı sıra web tarayıcıları AppleBot ile toplanan halka açık veriler de dahil olmak üzere lisanslı veriler üzerinde eğittiğini söylüyor. Web yayıncıları ise veri kullanım kontrolüyle web içeriklerinin Apple Intelligence eğitimi için kullanılmasını devre dışı bırakma seçeneğine sahip.