2014-11-19 5 views

Odpowiedz

6

Niniejszy dokument zawiera przegląd silnika: https://github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf

Wygląda więc na to, że nie trzeba zaimplementować canny.

Tesseract wykorzystuje Otsu progowanie do binarize obrazu przed przetworzeniem go https://github.com/tesseract-ocr/tesseract/blob/master/ccstruct/otsuthr.h

Edycja: Jeśli chcesz zobaczyć obrazu binarnego wystarczy utworzyć nowy plik konfiguracyjny w „\ tessdata \ configs \”, należy dodać linię: tessedit_write_images True i przetworzyć swój obraz: tesseract your_image out your_config_file. Tesseract zapisuje binaryzowany obraz jako tessinput.tif.

+0

Gdzie to zapisuje plik tessinput.tif? – kiwicomb123

+0

@neoneye @ cortex42 W moim katalogu '\ tessdata \ configs \' mam kilka plików, takich jak 'api_config', więc kiedy mówisz" Utwórz nowy plik konfiguracyjny ", masz na myśli tylko duplikowanie istniejącej konfiguracji? Jak mogę otworzyć te pliki, aby dodać sugerowaną linię? Gdzie będę mógł zobaczyć plik '.tif'? – Joshua