2010-12-28 10 views

Odpowiedz

6

proste rozwiązanie: Policz wystąpienia tego słowa w tekście.

Wykonanie dobrej pracy jest jednak trudnym problemem, nad którym pracują firmy takie jak Google od lat. Jeśli to możliwe, warto przyjrzeć using their technology

rozszerzyć, spróbuj wykonać następujące czynności:

  • używać słownika (np WordNet zastąpić wszystkie synonimy ze wspólnym słowem
  • Detect podobne słowa używając Levenshtein distance

To ci się uda. Musisz wykonać przetwarzanie w języku naturalnym, aby naprawdę zrozumieć, co opis ma rozróżnić wiele tek ts zawierające słowo kluczowe taką samą liczbę razy.

+0

Dziękujemy! Odległość Levenshteina była tym, o czym próbowałem sobie przypomnieć. W moim przypadku nie potrzebuję żadnego hardcorowego przetwarzania. Po prostu chcesz uzyskać wynik powyżej 100 za naprawdę krótki tekst opisu. – fgungor