2015-12-21 25 views
5

pomyślnie napisał plik traineddata nowego języka tesseract, ale kiedy skończył, ja w dalszym ciągu pojawia się następujący błąd:Indeks Tesseract> = 0 && index <size_used_: Błąd: Assert udało błąd

index >= 0 && index < size_used_:Error:Assert failed:in file ../ccutil/genericvector.h, line 657

Jednak zdarza się to nawet, gdy uruchamiam tesseract na obrazie, który trenowałem! Jestem zdezorientowany co do tego, co się dzieje, ponieważ spodziewałbym się, że błąd nie wystąpi, jeśli uruchomię tesseract na planie treningowym.

Odpowiedz

0

Ten błąd oznacza, że ​​trening zakończył się niepowodzeniem => przeoczyłeś komunikat o błędzie podczas treningu.

+0

Czy niepoprawny plik font_properties spowodowałby ten błąd? Nie otrzymałem komunikatów o błędach i o ile wiem, nie wydrukowano żadnych komunikatów o błędach. – vigneshv

+0

Zajrzyj tutaj: https://code.google.com/p/tesseract-ocr/issues/detail?id=821 – user898678

4

Ten błąd jest spowodowany brakiem pliku lang.shapetable w pliku lang.traineddata.


Upewnij się, że generują shapetable:

shapeclustering -F font_properties -U unicharset lang.font.exp0.box.tr 

To utworzy plik o nazwie shapetable. Przed połączeniem wszystkiego należy zmienić nazwę na lang.shapetable:

combine_tessdata lang.