1. Nauka
  2. /
  3. Kursy
  4. /
  5. Redukcja wymiarowości w Pythonie

Connected

ćwiczenie

Budowanie klasyfikatora cukrzycy

Do przewidywania, czy dana osoba ma cukrzycę, użyjesz zbioru danych Pima Indians diabetes i regresji logistycznej. Zbiór zawiera 8 cech i jedną zmienną docelową. Dane zostały podzielone na zbiór treningowy i testowy i są dostępne jako X_train, y_train, X_test oraz y_test.

Instancja StandardScaler() została wstępnie zdefiniowana jako scaler, a instancja LogisticRegression() – jako lr.

Instrukcje

100 XP
  • Dopasuj skaler do cech treningowych i jednocześnie przekształć te cechy.
  • Dopasuj model regresji logistycznej do przeskalowanych danych treningowych.
  • Przeskaluj cechy testowe.
  • Przewidź wystąpienie cukrzycy na przeskalowanym zbiorze testowym.