1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przewidywanie CTR z użyciem uczenia maszynowego w Pythonie

Connected

ćwiczenie

Regresja logistyczna do wykrywania raka piersi

W poprzednim ćwiczeniu przeprowadziliśmy wstępną analizę danych. Teraz zdefiniujesz podział na zbiór treningowy i testowy dla modelu regresji logistycznej na zbiorze danych dotyczącym raka piersi. To ważny pierwszy krok przed uruchomieniem każdego modelu uczenia maszynowego.

Zbiór danych o raku piersi pochodzi z biblioteki sklearn i zawiera różne cechy pacjentów oraz zmienną docelową wskazującą, czy dany pacjent ma raka piersi. Dane są przechowywane w formacie słownika: główne dane znajdują się w tablicy data, a wartości docelowe – w tablicy target. Oznacza to, że cancer_data.data zawiera cechy, a cancer_data.target – etykiety. Dane przykładowe są wczytane jako cancer_data, biblioteka pandas jest dostępna jako pd, a LogisticRegression jest dostępna z modułu sklearn.linear_model.

Instrukcje

100 XP
  • Zdefiniuj X i y, używając odpowiednio data i target.
  • Przypisz do X_train i y_train pierwsze 300 próbek z X i y, używając X[:300] dla X_train.
  • Przypisz do X_test i y_test pozostałe próbki z X i y (pomijając pierwsze 300), używając X[300:] dla X_test.