Çalışma mantığı bir plaka tanıma sistemi gibi olacak, ben ona önce bir listeyi kameradan taratacağım, taradığı listedeki verileri hafızasına kaydedecek, kaydettiği verileri kamerayı kullanarak tanımaya çalışacak, eşleşme sağlandığı zaman kontrol etmem için bana bilgi verecek. Yazılım yazma hakkında hiçbir şey bilmiyorum, böyle bir uygulamayı en basit şekilde nasıl yapabilirim? ChatGPT bana bu API'lerden yararlanabileceğimi söyledi;
Google Cloud Vision API: Bu API, OCR (Optik Karakter Tanıma) özellikleri ile birlikte gelir ve görüntüleri metne çevirir. Google Cloud Platform üzerinden kullanılabilir. Farklı programlama dilleri için SDK'lar ve API dokümantasyonları mevcuttur.
Microsoft Azure Computer Vision API: Bu API, OCR işlevleri ile birlikte görüntüleri analiz etmek için kullanılır. OCR özelliği sayesinde metne dönüştürme işlemini gerçekleştirebilirsiniz.
Mesela ben bir kitapta birkaç kişinin isminin geçtiği yerleri bulmak istiyorum, sayfaları tek tek göstereceğim ve o bulunca buldum diyecek.
OCR Kullanabilirsiniz. Basit bir çalışma mantığı var. YouTube üzerinde aratarak nasıl yapılır videoları bulabilirsin. Bu makaleye de göz atmak isteyebilirsiniz.