Jeśli zmienną czynnikową jest Klimat, z 4 możliwymi wartościami: Tropikalny, Suchy, Umiarkowany, Śnieg i węzeł w moim drzewie rpart
jest oznaczony jako "Klimat: ab", jaki jest podział?Jak interpretować podzielniki rpart na zmiennych czynnikowych podczas budowania drzew klasyfikacyjnych w R?
5
A
Odpowiedz
6
Zakładam użyć standardowego sposobu na działce drzewa, które jest
plot(f)
text(f)
Jak można przeczytać w pomocy do text.rpart
argument pretty
na domyślnych zmiennych czynników są przedstawione jako litery, więc a
oznacza levels(Climate)[1]
a to oznacza, że na lewym węźle są obserwacje z Climate==levels(Climate)[1]
, a po prawej pozostałe.
Można drukować bezpośrednio z poziomu
plot(f)
text(f, pretty=1)
ale zalecamy korzystanie draw.tree
z maptree package:
require(maptree)
draw.tree(f)
Kiedyś fałszywe dane do wykonania działek:
X <- data.frame(
y=rep(1:4,25),
Climate=rep(c("Tropical", "Arid", "Temperate", "Snow"),25)
)
f <- rpart(y~Climate, X)
To należy do stats.stackexchange.com i powinno być zamknięte. –
@Joris Nie zgadzam się. Pytanie dotyczy interpretacji odpowiedzi programu i nie ma nic wspólnego ze statycznym tłem podziału drzew i statystyką. – Marek
@ Marek Jak inaczej nazwałbyś interpretację analizy statystycznej? –