Claude ve GPT modelleri gayet yeterli ancak senin ciktilarini anlayip duzenlemen gerektigiyor.
Yazdigini copy paste edebilecegin bir model yok, sonradan Debug etmesi cok zor guvenlik aciklari ve Bug'larla ugrasirsin.
Ayrica modellerin programlama benchmarklari cok guvenilir degil, yazdiklari kodun dogrulugu ufak tasklar icin kontrol ediliyor ancak cok daha onemli bir ozellik olan projenin genel context windowundaki basarilari test edilmiyor. Zaten bunu objektif sekilde test etmek de zor.
Ellerinde bir soru seti var ( hackerrank vs de oldugu gibi ), modellere bunu prompt olarak verip ne kadar sürede ne kadar efektif ve ne kadar dogru cevap urettikleri olculuyor. Ama gercek dunyadaki problemlerin limitlenmis context icindeki programlama sorulariyla cok alakasiz oldugunu mulakata girip bir iste calisan her muhendis biliyordur.