Mam ramkę danych z 9 kolumn składającą się z inwentaryzacji czynników. Każdy rząd może mieć wypełnione wszystkie 9 kolumn (jak w tym wierszu zawiera 9 "rzeczy"), ale większość nie ma (większość ma od 3-4). Kolumny też nie są specyficzne, tak jak w przypadku, gdy pozycja 200 pojawia się w kolumnach 1 i 3, to jest to samo. Chciałbym utworzyć macierz, która jest binarna dla każdego wiersza, który zawiera wszystkie czynniki.Jak utworzyć binarną macierz ekwipunku na wiersz? (R)
Ex (skrócony do 4 kolumn tak aby uzyskać punkt w poprzek)
R1 3 4 5 8
R2 4 6 7 NA
R3 1 5 NA NA
R4 2 6 8 9
powinien przekształcić
1 2 3 4 5 6 7 8 9
r1 0 0 1 1 1 0 0 1 0
r2 0 0 0 1 0 1 1 0 0
r3 1 0 0 0 1 0 0 0 0
r4 0 1 0 0 0 1 0 1 1
Przyjrzeliśmy się writeBin/readBin K-klastrów (co jest coś chciałbym, ale najpierw muszę pozbyć się NA), klastrowania rozmytego, grupowania tagów. Po prostu trochę zagubiony w jakim kierunku pójść.
Próbowałem napisać dwa dla pętli, które pobierają dane z macierzy przez kolumnę/wiersz, a następnie zapisać odpowiednio 0 i 1 w nowej macierzy, ale myślę, że były problemy z zasięgiem.
Jesteście najlepsi. Dzięki!
+1 Ten kawałek cindla dmucha w moim umyśle. –
Josh, to robi wrażenie. Czy istnieje termin na to, co się nazywa? Myślałem o matrycy inwentarzowej, macierzy przedmiotów lub macierzy binarnej, ale wszystkie one wydają się odnosić do innych pomysłów. –
Dzięki. W moim rodzaju * myślę o * wyniku jako matrycy wskaźnikowej (po funkcji [wskaźnikowej] (http://en.wikipedia.org/wiki/Indicator_function)) macierzy obecności/nieobecności (ponieważ koduje ona czy nie każdy przedmiot jest obecny lub nieobecny w danym wierszu). Nie jestem pewien, czy istnieje akceptowalna nazwa ogólna. –