2012-04-05 26 views
27

Próbowałem Tesseract z iPhonem i oceniłem jego dokładność na 70% bez przetwarzania obrazu. Zauważyłem również, że może to być złe przy wyodrębnianiu cyfr. Słyszałem o silniku OCRopus OCR: co jest lepsze, Tesseract lub OCRopus, jeśli chodzi o ekstrakcję cyfr i czy mój preprocessing obrazu jest niski?
Czy ktoś uruchomił testy przy użyciu obu silników, porównując wyniki, korzystając z typowych danych?Który silnik OCR jest lepszy: Tesseract lub OCRopus?

+15

Nie rozumiem, dlaczego ta sprawa jest zamknięta. Silniki OCR można porównywać ze sobą pod względem dokładności - to bardzo obiektywne porównanie. Niewiele "opartych na opionie". –

Odpowiedz

28

Początkowo OCRopus faktycznie używał Tesseract jako silnika rozpoznawczego w środku, ale później zmienił go na własny nowy silnik. Jest wciąż świeży i nie dojrzały. Porównaliśmy dokładność rok temu, a OCRopus zdecydowanie przegrywał z Tesseract, nawet nie mówię o komercyjnych wersjach. Od tego czasu przestałem śledzić postępy OCRopus, ale wiem, że aktywność na forum pomocy OCRopus jest teraz bliska zeru. Oznacza to, że nikt go nie używa. Przeważnie ludzie używają silników komercyjnych, ale jeśli cena jest dla nich problemem i mogą tolerować mniejszą dokładność, to używają Tesseract. Jest zdecydowanie najlepszy wśród Open Source.

+4

Cześć Pomidor, jeśli chcemy używać komercyjnych silników, co polecacie? –

+2

ABBYY jest liderem na rynku OCR. W zależności od potrzeb i budżetu możesz wybrać między ABBYY FineReader Engine (http://abbyy.com/ocr_sdk), ABBYY Cloud OCR SDK (http://ocrsdk.com), ABBYY Mobile OCR Engine (http: // www. abbyy.com/mobileocr/) i ABBYY FlexiCapture Engine (http://www.abbyy.com/flexicapture_engine). Pracuję dla ABBYY i mogę Ci zapewnić dodatkowe informacje, jeśli potrzebujesz. –