2013-10-14 17 views
5

Mam problemy z używaniem coxph(). Mam dwie zmienne kategoryczne: płeć i prawdopodobną przyczynę, którą chcę użyć jako zmiennych predykcyjnych. Seks jest typowym mężczyzną/kobietą, ale Prawdopodobna przyczyna ma 5 opcji. Nie wiem, jaki jest problem z komunikatem ostrzegawczym. Dlaczego interwały przedziałów wynoszą od 0 do Inf, a wartości p tak wysokie?Ostrzeżenie coxph(): Loglik zbieżny przed zmienną

Oto kod i dane wyjściowe:

> my_coxph <- coxph(Surv(tempo,status) ~ factor(Sexo)+ factor(Causa.provavel) ,   data=ceabn) 
Warning message: 
In fitter(X, Y, strats, offset, init, control, weights = weights, : 
Loglik converged before variable 2,3,5,6 ; beta may be infinite. 

> summary(my_coxph) 
Call: 
coxph(formula = Surv(tempo, status) ~ factor(Sexo) + factor(Causa.provavel), 
data = ceabn) 

n= 43, number of events= 31 

              coef exp(coef) se(coef)  z Pr(>|z|) 
factor(Sexo)macho      7.254e-01 2.066e+00 4.873e-01 1.488 0.137 
factor(Causa.provavel)caca    2.186e+01 3.107e+09 9.698e+03 0.002 0.998 
factor(Causa.provavel)colisao linha MT 1.973e+01 3.703e+08 9.698e+03 0.002 0.998 
factor(Causa.provavel)indeterminado 9.407e-01 2.562e+00 1.683e+04 0.000 1.000 
factor(Causa.provavel)predacao   2.170e+01 2.655e+09 9.698e+03 0.002 0.998 
factor(Causa.provavel)predado   2.276e+01 7.659e+09 9.698e+03 0.002 0.998 

             exp(coef) exp(-coef) lower .95 upper .95 
factor(Sexo)macho      2.065e+00 4.841e-01 0.7947  5.368 
factor(Causa.provavel)caca    3.107e+09 3.219e-10 0.0000  Inf 
factor(Causa.provavel)colisao linha MT 3.703e+08 2.701e-09 0.0000  Inf 
factor(Causa.provavel)indeterminado 2.562e+00 3.904e-01 0.0000  Inf 
factor(Causa.provavel)predacao   2.655e+09 3.766e-10 0.0000  Inf 
factor(Causa.provavel)predado   7.659e+09 1.306e-10 0.0000  Inf 

Concordance= 0.752 (se = 0.059) 
Rsquare= 0.608 (max possible= 0.987) 
Likelihood ratio test= 40.23 on 6 df, p=4.105e-07 
Wald test   = 7.46 on 6 df, p=0.2807 
Score (logrank) test = 30.48 on 6 df, p=3.183e-05 

Dziękuję

Odpowiedz

8

Kiedy zapytałem Terry Therneau (autor pkg: survival) o tym kilka lat temu powiedział, że test, który jest wyzwalany generować ostrzeżenie jest zbyt wrażliwe. Ogólnie ostrzeżenie nie jest poprawne. Zwykle wystarczy spojrzeć na współczynniki, aby zobaczyć, że nie są one nieskończone.

W twoim przypadku jednak wydaje się, że poprawnie ostrzegasz, że mogą wystąpić problemy z twoimi danymi, ponieważ masz nieprawdopodobnie duże współczynniki. Współczynnik beta wynoszący 2,277e + 01 (= 22,7) w modelu wykładniczym jest po prostu absurdalnie wysoki. Szacowane ryzyko względne wynosi znacznie ponad milion! Powinieneś przyjrzeć się tabelarycznym klasyfikacjom swoich danych pod kątem problemów całkowitej separacji. Czy któraś z twoich grup kontrolnych umarła, eee, ma jakieś wydarzenie?

+0

Mam 31 wydarzeń w 43. Ale myślę, że masz rację, spartaczyłem dane. – JMarcelino