Nie mogłem znaleźć szczegółowej dokumentacji i nie czuję przeglądania kodu źródłowego. Nie chcę na nowo wykrywać niepożądanych krawędzi, na przykład, jeśli jest to już zrobione przez silnik Tesseract.Jakie operacje wstępnego przetwarzania są wykonywane przez Tesseract OCR?
5
A
Odpowiedz
6
Niniejszy dokument zawiera przegląd silnika: https://github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf
Wygląda więc na to, że nie trzeba zaimplementować canny.
Tesseract wykorzystuje Otsu progowanie do binarize obrazu przed przetworzeniem go https://github.com/tesseract-ocr/tesseract/blob/master/ccstruct/otsuthr.h
Edycja: Jeśli chcesz zobaczyć obrazu binarnego wystarczy utworzyć nowy plik konfiguracyjny w „\ tessdata \ configs \”, należy dodać linię: tessedit_write_images True
i przetworzyć swój obraz: tesseract your_image out your_config_file
. Tesseract zapisuje binaryzowany obraz jako tessinput.tif
.
Gdzie to zapisuje plik tessinput.tif? – kiwicomb123
@neoneye @ cortex42 W moim katalogu '\ tessdata \ configs \' mam kilka plików, takich jak 'api_config', więc kiedy mówisz" Utwórz nowy plik konfiguracyjny ", masz na myśli tylko duplikowanie istniejącej konfiguracji? Jak mogę otworzyć te pliki, aby dodać sugerowaną linię? Gdzie będę mógł zobaczyć plik '.tif'? – Joshua