Regresja logistyczna do wykrywania raka piersi

W poprzednim ćwiczeniu przeprowadziliśmy wstępną analizę danych. Teraz zdefiniujesz podział na zbiór treningowy i testowy dla modelu regresji logistycznej na zbiorze danych dotyczącym raka piersi. To ważny pierwszy krok przed uruchomieniem każdego modelu uczenia maszynowego.

Zbiór danych o raku piersi pochodzi z biblioteki sklearn i zawiera różne cechy pacjentów oraz zmienną docelową wskazującą, czy dany pacjent ma raka piersi. Dane są przechowywane w formacie słownika: główne dane znajdują się w tablicy data, a wartości docelowe – w tablicy target. Oznacza to, że cancer_data.data zawiera cechy, a cancer_data.target – etykiety. Dane przykładowe są wczytane jako cancer_data, biblioteka pandas jest dostępna jako pd, a LogisticRegression jest dostępna z modułu sklearn.linear_model.

Zdefiniuj X i y, używając odpowiednio data i target.
Przypisz do X_train i y_train pierwsze 300 próbek z X i y, używając X[:300] dla X_train.
Przypisz do X_test i y_test pozostałe próbki z X i y (pomijając pierwsze 300), używając X[300:] dla X_test.

ćwiczenie

Regresja logistyczna do wykrywania raka piersi

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie