Jakie operacje wstępnego przetwarzania są wykonywane przez Tesseract OCR?

Nie mogłem znaleźć szczegółowej dokumentacji i nie czuję przeglądania kodu źródłowego. Nie chcę na nowo wykrywać niepożądanych krawędzi, na przykład, jeśli jest to już zrobione przez silnik Tesseract.Jakie operacje wstępnego przetwarzania są wykonywane przez Tesseract OCR?

Źródło

2014-11-19 huehuehuehue

Niniejszy dokument zawiera przegląd silnika: https://github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf

Wygląda więc na to, że nie trzeba zaimplementować canny.

Tesseract wykorzystuje Otsu progowanie do binarize obrazu przed przetworzeniem go https://github.com/tesseract-ocr/tesseract/blob/master/ccstruct/otsuthr.h

Edycja: Jeśli chcesz zobaczyć obrazu binarnego wystarczy utworzyć nowy plik konfiguracyjny w „\ tessdata \ configs \”, należy dodać linię: tessedit_write_images True i przetworzyć swój obraz: tesseract your_image out your_config_file. Tesseract zapisuje binaryzowany obraz jako tessinput.tif.

Źródło

2014-12-01 14:50:55 cortex42

Gdzie to zapisuje plik tessinput.tif? – kiwicomb123

@neoneye @ cortex42 W moim katalogu '\ tessdata \ configs \' mam kilka plików, takich jak 'api_config', więc kiedy mówisz" Utwórz nowy plik konfiguracyjny ", masz na myśli tylko duplikowanie istniejącej konfiguracji? Jak mogę otworzyć te pliki, aby dodać sugerowaną linię? Gdzie będę mógł zobaczyć plik '.tif'? – Joshua

Jakie operacje wstępnego przetwarzania są wykonywane przez Tesseract OCR?

Odpowiedz

Powiązane problemy