2014-06-05 9 views
5

Próbuję uruchomić gridsearch z regresja logistyczna i uzyskaćGridSearchCV i regresja logistyczna podnieść ValueError: Nie można obsługiwać mieszankę ciągła i binarna

ValueError: Can't handle mix of continuous and binary 

Mam prześledzić ten błąd metrics.accuracy_score. Wygląda na to, że prognoza nie idzie tak dobrze, a podczas gdy y_true jest ciągła (podobnie jak pozostałe dane), y_pred jest zerowe i dlatego jest klasyfikowane jako binarne.

  • Czy istnieje sposób na uniknięcie tego błędu?
  • Czy charakter y_pred oznacza, że ​​w ogóle nie używam regresji logistycznej lub czy może to być wynikiem użytych parametrów?

Dzięki

Odpowiedz

3

Nieco łudząco regresji logistycznej jest faktycznie algorytm klasyfikacji (patrz http://scikit-learn.org/stable/modules/linear_model.html#logistic-regression). Jako takie dane docelowe ("y_true"), które je podajesz, powinny być binarne. Jeśli faktycznie próbujesz rozwiązać problem regresji, powinieneś wybrać inny algorytm, np. LinearRegression, SVR, RandomForestRegressor, itp.

+0

LogisticRegression może być stosowany, jeśli istnieje stała liczba etykiet –

+0

Pomimo powyższego komentarza, jest to oczywiście właściwa odpowiedź. Czuję się głupio, dzięki. – Korem

+0

@AbishekThakur, tak, to dobra uwaga, ale zauważ, że w przypadku LR scikit multi-class-learning używa owinąć jeden do wszystkich wokół binarnego algorytmu LR. – DavidS