Son kullanma tarihi geçmiş, bayatlamış bir tarayıcı kullanıyorsanız, Mercedes kullanmak yerine tosbağaya binmek gibi... Web sitelerini düzgün görüntüleyemiyorsanız eh, bi' zahmet tarayıcınızı güncelleyiniz. Modern Web standartlarını karşılayan bir tarayıcı alternatifine göz atın.
İçinde yazı olan resimleri text dosyasına topluca dönüştürmek
Tesseract ya da Ghostscript. Dosya eklenebiliyorsa kendi batch'imi göndereyim.
Önce Tesseract-OCR'ı kurun.
Windows binary'leri: Home · UB-Mannheim/tesseract Wiki
Tesseract-OCR kaynak kodu: Release 5.1.0 · tesseract-ocr/tesseract
Tesseract-OCR anasayfası: Tesseract documentation
Türkçe sözlük nereden indiriliyordu hatırlamıyorum ama adı: tur.traineddata
İnternette ararsınız.
Tesseract-OCR yalnız görüntü dosyaları ile çalışıyor. PDF, PS, djvu, mobi, vs. ile çalışmıyor.
Dosya adı veya yol/path'inde Türkçemize özgü harf bulunmamalı.
Benim kullandığım Windows batch:
Kod:
@ECHO OFF
CHCP 65001 >NUL
SETLOCAL EnableDelayedExpansion EnableExtensions
SET ATTR=%~a1
SET DIRATTR=%ATTR:~0,1%
SET TACTEXEPATH="%PROGRAMFILES%\Tesseract-OCR\tesseract.exe"
IF /I "%DIRATTR%"=="d" (
PUSHD %1
FOR /F "delims=" %%I in ('dir /A-D /B *.tif *.tiff *.jpg *.jpeg *.bmp 2^>NUL') DO (
CALL :TACTRUN "%~dpnx1\%%I"
)) ELSE (
FOR %%f in (%*) DO (
CALL :TACTRUN %%f
))
PAUSE
GOTO :EOF
:TACTRUN
ECHO OCRing %~nx1 in "%~dp1" via Tesseract
%TACTEXEPATH% -l tur %1 %1
REM %TACTEXEPATH% -l tur %1 "%~dpnx1"
:EOF
REM PUSHD %1
REM FOR /F "delims=" %%I in ('dir /A-D /B *.tif *.tiff *.jpg
ENDLOCAL
Bu batch'i güzel bir adla kaydedin. Ona bir kısayol oluşturun. OCR yapmak istediğiniz,
- tek görüntü dosyasını
- çok sayıda görüntü dosyasını
- tek/çok sayıda görüntü dosyası içeren tek bir klasörü
... kısayol üzerine sürükle bırak yapın.
Veya ek olarak, SendTo'ya koyun kısayolunu.
Yukarıdaki kodda, sadece, .jpg, .jpeg, tif, .tiff, .bmp'ler için yazlmış. Diğerlerini denemek gerekli.
Tesseract ya da Ghostscript. Dosya eklenebiliyorsa kendi batch'imi göndereyim.
Önce Tesseract-OCR'ı kurun.
Windows binary'leri: Home · UB-Mannheim/tesseract Wiki
Tesseract-OCR kaynak kodu: Release 5.1.0 · tesseract-ocr/tesseract
Tesseract-OCR anasayfası: Tesseract documentation
Türkçe sözlük nereden indiriliyordu hatırlamıyorum ama adı: tur.traineddata
İnternette ararsınız.
Tesseract-OCR yalnız görüntü dosyaları ile çalışıyor. PDF, PS, djvu, mobi, vs. ile çalışmıyor.
Dosya adı veya yol/path'inde Türkçemize özgü harf bulunmamalı.
Benim kullandığım Windows batch:
Kod:
@ECHO OFF
CHCP 65001 >NUL
SETLOCAL EnableDelayedExpansion EnableExtensions
SET ATTR=%~a1
SET DIRATTR=%ATTR:~0,1%
SET TACTEXEPATH="%PROGRAMFILES%\Tesseract-OCR\tesseract.exe"
IF /I "%DIRATTR%"=="d" (
PUSHD %1
FOR /F "delims=" %%I in ('dir /A-D /B *.tif *.tiff *.jpg *.jpeg *.bmp 2^>NUL') DO (
CALL :TACTRUN "%~dpnx1\%%I"
)) ELSE (
FOR %%f in (%*) DO (
CALL :TACTRUN %%f
))
PAUSE
GOTO :EOF
:TACTRUN
ECHO OCRing %~nx1 in "%~dp1" via Tesseract
%TACTEXEPATH% -l tur %1 %1
REM %TACTEXEPATH% -l tur %1 "%~dpnx1"
:EOF
REM PUSHD %1
REM FOR /F "delims=" %%I in ('dir /A-D /B *.tif *.tiff *.jpg
ENDLOCAL
Bu batch'i güzel bir adla kaydedin. Ona bir kısayol oluşturun. OCR yapmak istediğiniz,
- tek görüntü dosyasını
- çok sayıda görüntü dosyasını
- tek/çok sayıda görüntü dosyası içeren tek bir klasörü
... kısayol üzerine sürükle bırak yapın.
Veya ek olarak, SendTo'ya koyun kısayolunu.
Yukarıdaki kodda, sadece, .jpg, .jpeg, tif, .tiff, .bmp'ler için yazlmış. Diğerlerini denemek gerekli.
Ouv. Yukarıda yazdıklarımı boşverim. Batch, işletim sistemlerinin konsol (console) kabuğu (shell) yığın (batch) sistemidir. DOS'tan gelen Windows'a da geçmiş olan, DOS/Windows batch de, Windows'un kabuk yığın sistemidir.
Tesseract ya da Ghostscript. Dosya eklenebiliyorsa kendi batch'imi göndereyim.
Önce Tesseract-OCR'ı kurun.
Windows binary'leri: Home · UB-Mannheim/tesseract Wiki
Tesseract-OCR kaynak kodu: Release 5.1.0 · tesseract-ocr/tesseract
Tesseract-OCR anasayfası: Tesseract documentation
Türkçe sözlük nereden indiriliyordu hatırlamıyorum ama adı: tur.traineddata
İnternette ararsınız.
Tesseract-OCR yalnız görüntü dosyaları ile çalışıyor. PDF, PS, djvu, mobi, vs. ile çalışmıyor.
Dosya adı veya yol/path'inde Türkçemize özgü harf bulunmamalı.
Benim kullandığım Windows batch:
Kod:
@ECHO OFF
CHCP 65001 >NUL
SETLOCAL EnableDelayedExpansion EnableExtensions
SET ATTR=%~a1
SET DIRATTR=%ATTR:~0,1%
SET TACTEXEPATH="%PROGRAMFILES%\Tesseract-OCR\tesseract.exe"
IF /I "%DIRATTR%"=="d" (
PUSHD %1
FOR /F "delims=" %%I in ('dir /A-D /B *.tif *.tiff *.jpg *.jpeg *.bmp 2^>NUL') DO (
CALL :TACTRUN "%~dpnx1\%%I"
)) ELSE (
FOR %%f in (%*) DO (
CALL :TACTRUN %%f
))
PAUSE
GOTO :EOF
:TACTRUN
ECHO OCRing %~nx1 in "%~dp1" via Tesseract
%TACTEXEPATH% -l tur %1 %1
REM %TACTEXEPATH% -l tur %1 "%~dpnx1"
:EOF
REM PUSHD %1
REM FOR /F "delims=" %%I in ('dir /A-D /B *.tif *.tiff *.jpg
ENDLOCAL
Bu batch'i güzel bir adla kaydedin. Ona bir kısayol oluşturun. OCR yapmak istediğiniz,
- tek görüntü dosyasını
- çok sayıda görüntü dosyasını
- tek/çok sayıda görüntü dosyası içeren tek bir klasörü
... kısayol üzerine sürükle bırak yapın.
Veya ek olarak, SendTo'ya koyun kısayolunu.
Yukarıdaki kodda, sadece, .jpg, .jpeg, tif, .tiff, .bmp'ler için yazlmış. Diğerlerini denemek gerekli.