Chcę obliczyć znaczenie słowa kluczowego w krótkim tekście opisu. Jakie byłoby najlepsze podejście pod względem wydajności i łatwości wdrożenia. Używam C++?Algorytm obliczania trafności słowa kluczowego na krótki tekst (50-100 słów)
5
A
Odpowiedz
6
proste rozwiązanie: Policz wystąpienia tego słowa w tekście.
Wykonanie dobrej pracy jest jednak trudnym problemem, nad którym pracują firmy takie jak Google od lat. Jeśli to możliwe, warto przyjrzeć using their technology
rozszerzyć, spróbuj wykonać następujące czynności:
- używać słownika (np WordNet zastąpić wszystkie synonimy ze wspólnym słowem
- Detect podobne słowa używając Levenshtein distance
To ci się uda. Musisz wykonać przetwarzanie w języku naturalnym, aby naprawdę zrozumieć, co opis ma rozróżnić wiele tek ts zawierające słowo kluczowe taką samą liczbę razy.
3
Patrz na te poprzednie pytania przepełnienie stosu:
Dziękujemy! Odległość Levenshteina była tym, o czym próbowałem sobie przypomnieć. W moim przypadku nie potrzebuję żadnego hardcorowego przetwarzania. Po prostu chcesz uzyskać wynik powyżej 100 za naprawdę krótki tekst opisu. – fgungor