2009-09-16 22 views
9

Moje czytanie tego article sugeruje, że korzyścią ReCAPTCHA jest to, że ludzie mogą weryfikować słowa nie rozpoznane w OCR/digitalizacji książek. Czyni to, używając tych słów w "Czy jesteś człowiekiem?" testy. ReCAPTCHA zabija dwa ptaki jednym kamieniem. Wspaniały!Jak działa ReCAPTCHA?

Ale nie rozumiem tego. Jeśli słowo to nie może zostać rozpoznane przez proces digitalizacji, to w jaki sposób dane wejście, przez rzekomą istotę ludzką, zostało zweryfikowane? Jak to działa?

Odpowiedz

23

Pokazuje dwa słowa. Jeden z nich komputer już wie, drugi nie. Zakłada się, że jeśli dobrze znasz znaną, musisz znać drugą.

Nie wiesz, który z nich jest już znany, więc teoretycznie nie możesz go oszukać. Dodatkowo odtworzy słowo z wieloma osobami, aby uzyskać niezależne potwierdzenie przed wysłaniem go z powrotem do źródła (firma gazetowa, grupa skanowania książek) jako poprawna odpowiedź.

Ale jeśli komputer nie może odczytać taką CAPTCHA, w jaki sposób system znać prawidłową odpowiedź do układanki ? Oto: jak: Każde nowe słowo, które nie może być odczytane poprawnie przez OCR jest podane użytkownikowi w w połączeniu z innym słowem dla , którego odpowiedź jest już znana. Użytkownik jest następnie proszony o odczytanie obu słów. Jeśli zostaną rozwiązane, dla którego znana jest odpowiedź , system przyjmuje ich odpowiedź jest poprawna dla nowego . Następnie system podał nowy numer wielu osobom, aby ustalić, z dużą pewnością, , czy oryginalna odpowiedź brzmi: .

http://recaptcha.net/learnmore.html

+0

Chciałbym zauważyć, że ReCAPTCHA działa, pokazując dwa słowa, jeden, który wie, a drugi nie. Trzeba tylko uzyskać jeden poprawny. Jednak ponownie przesyłają ten, który nie kilka razy, aż otrzymają wysoki procent, że jest to prawidłowe, zanim je wchłonąć jako takie. –

+0

Dobrze, system nie jest głupim dowodem, choć jest sprytny. Przypomina mi Obrazek gry Google Labeler który działa według tych samych zasad, aby uzyskać nieznanych osób do znakowania zdjęć: http://images.google.com/imagelabeler/ –

+0

Imagelabeler i ReCapcha są przez tego samego faceta Luis von Ahn:. Naprawdę poprowadził ludzi do rozwiązywania trudnych problemów. –

2

Cytat z LEARN HOW reCAPTCHA WORKS

Ale jeśli komputer nie może odczytać taką CAPTCHA, w jaki sposób system znać prawidłową odpowiedź układanki? Oto jak: Każde nowe słowo, które nie może być odczytane poprawnie przez OCR, otrzymuje użytkownik w połączeniu z innym słowem, dla którego odpowiedź jest już znana. Użytkownik jest następnie proszony o odczytanie obu słów. Jeśli rozwiązują ten, dla którego odpowiedź jest znana, system przyjmuje, że odpowiedź jest poprawna dla nowej. Następnie system przekazuje nowy obraz wielu innym osobom, aby z większą pewnością stwierdzić, czy oryginalna odpowiedź była prawidłowa.