OpenAI o3, ARC-AGI benchmark testinde %85 başarı göstermiş. Ayrıca çok zor matematik testlerinde de iyi sonuçlar almış:
OpenAI’s o3 model scored at human level on a benchmark test for artificial general intelligence – far higher than any results before.
İnsan zekasını ölçmek için kullanılan testlerle neredeyse aynıymış. Bundan sonraki aşama ise "kendi kendini geliştiren yapay zeka" olduğu söyleniyor:
OpenAI, yeni yapay zekâ modeli O3'ün ARC-AGI kıyaslama testini başarıyla aştığını açıkladı.
Daha önce OpenAI, modellerin eğitimi için matematikçiler, fizikçiler ve programcılar gibi bilimadamlarına özgün içerik üretmeleri adına para ödüyordu. o3 modelini eğitmek için ise o1 modelinin ürettiği içerikleri kullanmaya başlamışlardı. Bence bundan sonraki aşama kod anlamında da modellerin kendi kendilerini geliştirmeye başlaması olabilir.