6

Mam wiele .jpeg ze stron internetowych muzyków. Obrazy te składają się z plakatów dla nadchodzących koncertów i zdjęć zespołu (zdjęcia zespołu w prawdziwym życiu).Jak wykryć, czy zdjęcie jest plakatem (nierealne)?

Oto przykład plakatu:

enter image description here

nie jestem dobrze zorientowany w dowolnych nowoczesnych technik i algorytmów (? Jeśli takie istnieją), ale to, co myślałem, że mogę patrzeć na:

  • Tekst na obrazie to zazwyczaj martwy prezent z plakatu.
  • Być może realistyczne zdjęcia (np. Post-posters) mają inny rozkład kolorów?
  • Plakaty prawdopodobnie nie mają twarzy - ale to dość słabe stwierdzenie.

Czy istnieje algorytm klasyfikacji, który może wykryć, czy obraz jest plakatem?

Odpowiedz

11

Twoje pytanie jest bardzo szerokie. Plakat lub zdjęcie nie jest dobrze zdefiniowanym obiektem. Czym jest plakat? W rzeczywistości plakaty to często zdjęcia lub kombinacja zdjęć lub trochę poprawionych zdjęć.

Jeśli zawęzimy do pierwszej części twojego pytania - zdjęcia z zespołu kontra nadchodzące plakaty, to odpowiedź brzmi - prawdopodobnie tak (chociaż nigdy nie widziałem, żeby ktoś to robił). Kiedy szukasz binarnego klasyfikatora, sugerowałbym wzięcie jakiegoś modelu uczenia maszynowego (Naive Bayes powinien wystarczyć, ale jeśli chcesz użyć bardziej złożonych cech, spróbuj użyć SVM, ELM lub niektórych Losowych Lasu/Drzewa decyzyjnego) i zastosuj go do danych zakodowanych w wektorach zawierających:

binarne funkcje:

  • „jest jakieś słowo na obrazie?” - trzeba będzie algorytm wykrywania tekstu zewnętrzny
  • „jest tam numer na obrazie” - wydarzenia powinny mieć termin
  • „jest tam data na obrazie”
  • „jest jakaś twarz na obrazie”

Korzystanie Naive Bayesa by zbudować propabilities warunkowe P(poster|there is a word), P(poster|there is a number) itd., które nie tylko daje klasyfikatora, ale również pewne spostrzeżenia, jak ważne są twoje featuers (prawdopodobieństwo blisko 0.5 to sugestia, że ​​dana funkcja jest bezużyteczny).

Nie używałbym histogramów itp. Ze względu na szeroki zakres możliwych zdjęć, stylów sesji zdjęciowych itp., Chyba że jesteś gotów stworzyć naprawdę duży zestaw treningowy.

Jeśli to nie wystarczy, możesz zmienić je na bardziej złożone funkcje i użyć bardziej zaawansowanego klasyfikatora niż Naive Bayes.

Kompleksowe funkcje:

  • Ile słowa są tam na obrazie?
  • Ile jest liczb na obrazie?
  • Ile dat jest na zdjęciu?
  • Ile twarzy znajduje się na obrazie?
  • histogram obrazu

I ostatnia opcja, jeśli wszystko zawiedzie, można spróbować trenować jakiś nowoczesny model, podobnie jak głębokiego Belief sieci na surowych obrazów. Wymagałoby to poważnej mocy obliczeniowej, ale wyniki byłyby bardzo cenne również dla społeczności naukowej.