2012-03-12 5 views
10

Czytałem wiele dokumentów na temat algorytmów lokalizacja/detekcji tablic rejestracyjnych, takich jak te wymienione tutaj:dane publiczne ustawione dla tablicy rejestracyjnej lokalizacja/wykrywania

What are good algorithms for vehicle license plate detection?

Miałem nadzieję uruchomić kopalnię na zbiorze danych samochodów ze znanymi numerami licencji, dzięki czemu mogę zmierzyć błąd.

Po sporym obciążeniu nie mogę znaleźć żadnych publicznie dostępnych zestawów danych tego rodzaju. Czy ktoś o tym wie? Jeśli nie, następnym krokiem będzie wysłanie e-maila do autorów papieru.

+0

Możesz mieć pecha na tym. Tablice rejestracyjne pojazdu są uważane za informacje umożliwiające identyfikację osoby w celu ochrony danych. Dlatego każda publiczna baza danych takich informacji prawie na pewno byłaby niezgodna z prawem. Mogą istnieć organizacje, które sprzedają takie informacje, po ich przefiltrowaniu (miejmy nadzieję) w celu usunięcia obrazów wszelkich pojazdów, których właściciele nie chcą, aby były uwzględnione, jednak w wielu krajach byłoby to niezgodne z prawem. –

+0

Dlaczego w pierwszej kolejności nie wysłałeś e-maila do autorów o zestawach danych? – monksy

+0

Byłem zaniepokojony legalności publicznego zestawu. Pomyślałem, że opublikuję pytanie, żeby sprawdzić, czy ktokolwiek znalazł coś oczywistego, co przeoczyłem, a więc byłby to publiczny zapis dla innych szukających tego samego, ponieważ to pytanie nie było wcześniej zadawane. –

Odpowiedz

11

Nie jestem pewien, jak to jest nielegalne opublikowały zestawów danych testowych obrazów wszelkiego rodzaju podejmowanych w przestrzeni publicznej, ponieważ zostało wykonane i zostały one wykorzystane w dokumentach dla celu sprawdzania wyników, ale nie wiem, jaki poziom uzyskania zgody był niezbędny do opublikowania zbioru danych. To sprawia, że ​​chcesz pomyśleć zanim wyjdziesz i zrobisz kilka zdjęć, a następnie je opublikujesz. Wiem, że widok ulicy w Google rozmazuje wszystkie tablice, dokładnie psując coś, co powinno być prawie nieograniczoną kopalnią danych z analizy płyt. Wciąż jest to kopalnia złota z lokalizacji z naturalnych scenerii, ale frustrująca z perspektywy płyty. To może wyjaśniać, dlaczego tak trudno znaleźć łatwo dostępne dobre zbiory danych. Można by pomyśleć, że będziemy mieli dość standardowy zbiór dziesiątek tysięcy płyt gdzieś. Wyszukiwarka obrazów Google "z tyłu samochodu" w rzeczywistości daje mniej wyników, niż można się było spodziewać, i trzeba trochę zbierania wiśni, aby wyeliminować obrazy, które nie działają.

Strona Medialab opublikowana przez @Abosamra jest naprawdę dobra, choć są to płyty greckie, a nie amerykańskie.

Z http://www.vision.caltech.edu/html-files/archive.html, samochody z 1999 roku (z tyłu) są świetne, choć jest ich tylko 126. Jest to zdecydowanie najlepszy amerykański zbiór danych, który można natychmiast pobrać, w tym samochody w naturalnych scenach z wyraźnie czytelnymi tablicami.

Zdjęcia z tej samej witryny z 2001 r. Zawierają wiele powtórzeń i są w większości zbyt niską rozdzielczością, aby można je było wykorzystać do testowania OCR, ale można je wykorzystać do testowania lokalizacji płyt, a jest ich ponad 500.

Oxford jest ponowne opublikowanie samochody Caltech z pierwszego linku wraz z dużo większego zbioru danych z 1155 zdjęć samochodów zbyt małe dla OCR, ale może być przydatna dla procesu wykrywania samochodu:

http://www.robots.ox.ac.uk/~vgg/data3.html

MIT ma zestaw danych, który początkowo wydaje się obiecujący, ale potem okazuje się, że płytki są zbyt małe, aby wykonać OCR, i są w formacie ppm, więc może wymagać dodatkowego dodatkowego stopnia, aby przekształcić je w bardziej ogólnie używany format pliku. Mogą być przydatne do testów lokalizacji.

http://cbcl.mit.edu/projects/cbcl/software-datasets/CarData1Readme.html

UCSD posiada zestaw około 878 obrazów, ale wymaga uzyskaniem zgody Louka Dlagnekov lub Serge Belongie dostępu do zbioru danych. http://vision.ucsd.edu/belongie-grp/research/carRec/car_data.html

Jeśli nie masz nic przeciwko używaniu płyt poza Stanami Zjednoczonymi, możesz znaleźć więcej zestawów danych. Oto jeden, na przykład w Chorwacji, ale ma 510 zdjęć, które są dobrej jakości.Są nieco powiększone, więc nie są świetne do testowania możliwości wyciągnięcia samochodu z naturalnej sceny, ale bardzo dobrze nadają się do identyfikacji talerzy.

http://www.zemris.fer.hr/projects/LicensePlates/hrvatski/rezultati.shtml

Ponieważ prawdziwe płyty są tak trudne do znalezienia w scenach samochodowych, może to być możliwe, aby zestaw danych za pomocą fałszywych tablic. Tu jest miejsce, które może tworzyć fałszywe tablice:

http://acme.com/licensemaker/

Fałszywe płyty może być idealny do tworzenia zestawu danych test płyt się do segmentacji i fazy rozpoznawania znaków z problemu z dużą ilością różnych płyt środowisk i czcionki.

Jedyne, co pozostało, to znaleźć sposób na umieszczenie niektórych przypadkowo utworzonych fałszywych płytek na niektórych obrazach z rozmytymi płytkami.

Mogę zaktualizować mój post, jeśli znajdę więcej.