Türkçe karakter destekli PDF to Text AI uygulama önerisi

chaturanga

Hectopat
Katılım
17 Ağustos 2021
Mesajlar
5.746
Çözümler
41
Daha fazla  
Cinsiyet
Erkek
Arkadaşlar resim gibi taranmış PDF dosyasında yer alan metinleri çıkarabilecek ve Türkçe karakterleri de tanıyan bir yapay zeka uygulaması var mı?
 
Çözüm @hus3yin46 tarafından sunulmuş. Ancak yapay zeka istiyorsanız, özellikle bu konuda ısrarcıysanız lm-studo'da ücretsiz modellerden işinize yarayan bir model bulabilirsiniz. Bir modelin Türkçe karakteri özel olarak tanımaması için bir neden göremiyorum.
 
Hocam Google lens e aktarın o metin olarak çıkarıyor zaten.

Hocam teşekkürler ama Google lens resimden almıyor mu? 150 sayfalık bir kitap. Yani tek tek aktarmak yerine PDF'ten doğrudan metin dosyası olarak kelimeleri çıkaran bir programa ihtiyacım var.

Çözüm @hus3yin46 tarafından sunulmuş. Ancak yapay zeka istiyorsanız, özellikle bu konuda ısrarcıysanız lm-studo'da ücretsiz modellerden işinize yarayan bir model bulabilirsiniz. Bir modelin Türkçe karakteri özel olarak tanımaması için bir neden göremiyorum.

Birkaç sayfalık bir şey değil, Google Lens 150 sayfalık bir kitabı yüklememe ve içindeki metinleri almama yardımcı olabiliyor mu?

Çözüm @hus3yin46 tarafından sunulmuş. Ancak yapay zeka istiyorsanız, özellikle bu konuda ısrarcıysanız lm-studo'da ücretsiz modellerden işinize yarayan bir model bulabilirsiniz. Bir modelin Türkçe karakteri özel olarak tanımaması için bir neden göremiyorum.

Ek olarak bir tane yapay zeka uygulaması bulmuştum ancak Türkçe karakterleri tanımadı. En yakın İngilizce karakterlerle yazarak verdi bana. Bu yüzden daha düzgün yapabilen bir yapay zeka uygulaması var mıdır diye konuyu açtım.
 
Calibre gibi e kitap okuyucularında metin seçme özelliği var, tüm kitabı topluca seçebilmelisiniz. Tabii siz PDF diyorsunuz. PDF fotoğraflardan oluşuyor olabilir. Önde Word'a çevirmeyi deneyebilir misiniz? Eğer PDF biçimi uygunsa bu sizin sorununuzu Calibre'ye başvurmadan çözmeli.

Eğer olmazsa lm-Studio'dan model arama işine girişmelisiniz. Direk picture to text diye aratıp bir model bulabilirsiniz.

Ben kullanmıyorum, o yüzden sürecin bu kadar düz olacağını garanti edemem. 10 dakikalık bir tutorial izleyebilirsiniz.

Sizin düzenlemenize yanıt: Eğer hepsini aynı karaktere çevirdiyse basit bir Python kodu ile sorunu çözmek daha mantıklı. Mesela her "ğ" harfi atıyorum ß (eszed) olmuşsa kod içerisinde her ß harfini "ğ" ile değiştirmeyi yazabilirsiniz. Daha iyisi kodu chat GPT bile yazabilir.
 
Calibre gibi e kitap okuyucularında metin seçme özelliği var, tüm kitabı topluca seçebilmelisiniz. Tabii siz PDF diyorsunuz. PDF fotoğraflardan oluşuyor olabilir. Önde Word'a çevirmeyi deneyebilir misiniz? Eğer PDF biçimi uygunsa bu sizin sorununuzu Calibre'ye başvurmadan çözmeli.

Eğer olmazsa lm-Studio'dan model arama işine girişmelisiniz. Direk picture to text diye aratıp bir model bulabilirsiniz.

Ben kullanmıyorum, o yüzden sürecin bu kadar düz olacağını garanti edemem. 10 dakikalık bir tutorial izleyebilirsiniz.

Sizin düzenlemenize yanıt: Eğer hepsini aynı karaktere çevirdiyse basit bir Python kodu ile sorunu çözmek daha mantıklı. Mesela her "ğ" harfi atıyorum ß (eszed) olmuşsa kod içerisinde her ß harfini "ğ" ile değiştirmeyi yazabilirsiniz. Daha iyisi kodu chat GPT bile yazabilir.

Teşekkür ederim, maalesef yukarıda belirttiğim gibi Ç, Ş, Ğ gibi harfleri değişik karakterlere çevireceğine en yakın İngilizce karakterlere dönüştürmüş. I i olmuş, Ğ G olmuş, Ş S olmuş vs vs.. Bahsettiğiniz şekilde özel karakterlere dönüştürseydi Word hatta Notepadde hepsini düzeltebilirdim değiştirme özelliği sayesinde ama yapamıyorum bu yüzden :)

Neyse cevaplarınız için teşekkürler biraz araştırayım birkaç farklı uygulama daha deneyeyim en ideali hangisiyse onunla ilerlerim.
 

Yeni konular

Geri
Yukarı