Podczas korzystania z XGBoost
musimy przekonwertować zmienne kategoryczne na liczbowe.XGBoost Zmienne kategoryczne: Dummification vs encoding
Byłoby jakakolwiek różnica wskaźników wydajności/ocena pomiędzy sposobami:
- dummifying zmienne kategoryczne
- kodujące zmienne kategoryczne z np (A, b, c) do (1,2,3)
również:
Byłoby jakichkolwiek powodów nie jest dostępny do metody 2, za pomocą na przykład labelencoder
?
nie uczyni to z wielu możliwości kategorie pojawiają się ważniejsze niż z mniej? – eleanora
Jak 'Xgboost' wie, jak traktować' array ([1., 0., ...]) 'jako kategoryczny zamiast numerycznego? –
@ThiagoBalbo Po prostu: nie. Po prostu zamieniasz oryginalną zmienną/cechę/kolumnę na 3 zmienne binarne/funkcje/kolumny. – masu