2009-04-03 7 views
9

Szukam algorytmów, dokumentów lub oprogramowania do ulepszania faksów, obrazów z kamer komórkowych i innych podobnych źródeł dla czytelności i OCR.Algorytmy przetwarzania/ulepszania obrazu dla dokumentu OCR/czytelność?

Interesują mnie głównie proste ulepszenia (np. Rzeczy, które można robić przy użyciu ImageMagick), ale interesują mnie również bardziej wyrafinowane techniki. Rozmawiam już z dostawcami, więc na to pytanie szukam głównie algorytmów lub oprogramowania open source.

Aby dokładniej wyjaśnić: Nie szukam oprogramowania OCR ani algorytmów; Poszukuję algorytmów czyszczenia obrazu, aby wygląd był bardziej czytelny dla ludzkiego oka i może być użyty do rozpoznawania OCR.

Odpowiedz

5

miałem podobny problem, kiedy pisałem jakiś program do zrobienia skanowanie książek; poruszanie się po Internecie to program o nazwie pagetools, który prostuje zeskanowane strony za pomocą dość sprytnej sztuczki matematycznej zwanej transformacją Radona.

Napisałem też małą procedurę, która rozjaśnia puste miejsce na stronie; Algorytmy OCR mają tendencję do czynienia dużo lepiej, gdy nie muszą radzić sobie z hałasem w tle. To, co zrobiłem, polegało na szukaniu jasnych pikseli oddalonych od ciemnego koloru o więcej niż mały promień, a następnie zwiększenie ich do czystej bieli.

Jednak minęło już kilka lat, więc nie mam dokładnych szczegółów dotyczących implementacji.

4

Jednym z prostych filtrów obrazu, który można obejrzeć jest "Filtr Median", który jest bardzo prostym, łatwym do wdrożenia, filtrem pomagającym w oczyszczeniu zeskanowanego/sfotografowanego tekstu. http://en.wikipedia.org/wiki/Median_filter