2011-08-07 15 views
8

Chcę, aby klastry rozmyte zestaw miejsc pracy. Praca Atrybuty są:Zmienne zmienne (kategoryczne i numeryczne) funkcja odległości

  1. kategoryczne: pozycja, dyplom, umiejętności
  2. numeryczne: wynagrodzenia, lata doświadczenia

Moje pytanie brzmi: w jaki sposób obliczyć odległość między różne miejsca pracy?
np Job1 (programista Science bs komputera (Jawa, NET odpowiedzialność), 1500, 3)
i Job2 (tester, bs Computer Science (testowanie czarne i białe), 1200,1)

PS: Jestem początkujący w klastrze eksploracji danych, bardzo dziękuję za pomoc.

Odpowiedz

2

Oto dobry przechodni z kilku różnych metod grupowania i jak z nich korzystać w R: http://biocluster.ucr.edu/~tgirke/HTML_Presentations/Manuals/Clustering/clustering.pdf

Ogólnie klastrów dla dyskretnych danych jest związane zarówno z wykorzystaniem morfologii (np zachodzi w wektorach) lub związane z niektórymi statystykami pochodzącymi z liczników. Mimo że chciałbym odnieść się do strony statystycznej, przypuszczam, że interesuje cię algorytm, więc to zostawię.