OpenAI o3, ARC-AGI benchmark testinde %85 başarı göstermiş. Ayrıca çok zor matematik testlerinde de iyi sonuçlar almış:
theconversation.com
İnsan zekasını ölçmek için kullanılan testlerle neredeyse aynıymış. Bundan sonraki aşama ise "kendi kendini geliştiren yapay zeka" olduğu söyleniyor:
www.webtekno.com
Daha önce OpenAI, modellerin eğitimi için matematikçiler, fizikçiler ve programcılar gibi bilimadamlarına özgün içerik üretmeleri adına para ödüyordu. o3 modelini eğitmek için ise o1 modelinin ürettiği içerikleri kullanmaya başlamışlardı. Bence bundan sonraki aşama kod anlamında da modellerin kendi kendilerini geliştirmeye başlaması olabilir.
An AI system has reached human level on a test for ‘general intelligence’. Here’s what that means
OpenAI’s o3 model scored at human level on a benchmark test for artificial general intelligence – far higher than any results before.
theconversation.com
İnsan zekasını ölçmek için kullanılan testlerle neredeyse aynıymış. Bundan sonraki aşama ise "kendi kendini geliştiren yapay zeka" olduğu söyleniyor:
OpenAI, Yeni Yapay Zekâ Modelinin 'İnsan Seviyesine' Ulaştığını İddia Ediyor
OpenAI, yeni yapay zekâ modeli O3'ün ARC-AGI kıyaslama testini başarıyla aştığını açıkladı.
Daha önce OpenAI, modellerin eğitimi için matematikçiler, fizikçiler ve programcılar gibi bilimadamlarına özgün içerik üretmeleri adına para ödüyordu. o3 modelini eğitmek için ise o1 modelinin ürettiği içerikleri kullanmaya başlamışlardı. Bence bundan sonraki aşama kod anlamında da modellerin kendi kendilerini geliştirmeye başlaması olabilir.