Używam pytesseract i przyjrzałem się niektórym rozwiązaniom grupowym Google, ale nie działają one dla mnie.pytesseract nie może znaleźć określonego pliku
Mój kod jest prosta i jest następujący:
from PIL import ImageFilter
import sys
from PIL import Image
import PIL.ImageOps
import pytesseract
import time
image=Image.open("C:/temp/download.png")
image.load()
background = Image.new("RGB", image.size, (255, 255, 255))
background.paste(image, mask=image.split()[3]) # 3 is the alpha channel
background.save('C:/temp/foo.jpg', 'JPEG', quality=80)
img =Image.open('C:/temp/foo.jpg')
img.load()
print img
print '-------------------'
i = pytesseract.image_to_string(img)
print i
i odpowiedź błąd wrócę jest:
Traceback (most recent call last):
File "img.py", line 20, in <module>
i = pytesseract.image_to_string(img)
File "build\bdist.win32\egg\pytesseract\pytesseract.py", line 161, in image_to
_string
File "build\bdist.win32\egg\pytesseract\pytesseract.py", line 94, in run_tesse
ract
File "C:\Users\%USER%\AppData\Local\Continuum\Anaconda\lib\subprocess.py",
line 710, in __init__
errread, errwrite)
File "C:\Users\%USER%\AppData\Local\Continuum\Anaconda\lib\subprocess.py",
line 958, in _execute_child
startupinfo)
WindowsError: [Error 2] The system cannot find the file specified
Wszelkie wskazówki byłyby fantastyczne.
Dodawanie tesseract do mojego zmiennej PATH pomogło: C:\Program Files (x86)\Tesseract-OCR
ale kod teraz ulega awarii podczas próby uruchomienia kawałek pytesseract.
Można spróbować użyć tej innej biblioteki korzystać tesseract w Pythonie: [pyslibtesseract] (https://github.com/brunomacabeusbr/pyslibtesseract). Ta biblioteka używa innego sposobu ładowania obrazu. – Macabeus