MulaiMulai sekarang secara gratis

Regresi logistik untuk kanker payudara

Pada latihan sebelumnya, kita melakukan evaluasi awal terhadap data. Pada latihan ini, Anda akan mendefinisikan pemisahan data pelatihan dan pengujian untuk model regresi logistik pada himpunan data kanker payudara. Ini adalah langkah awal yang penting untuk menjalankan semua model Machine Learning.

Himpunan data kanker payudara adalah contoh himpunan data dari sklearn dengan berbagai fitur dari pasien, dan nilai target berupa apakah pasien menderita kanker payudara atau tidak. Data berbentuk kamus, di mana data utama disimpan dalam array bernama data, dan nilai target disimpan dalam array bernama target. Jadi, cancer_data.data berisi fitur dan cancer_data.target berisi target. Contoh data dimuat sebagai cancer_data bersama pandas sebagai pd. LogisticRegression tersedia melalui sklearn.linear_model.

Latihan ini adalah bagian dari kursus

Memprediksi CTR dengan Machine Learning di Python

Lihat Kursus

Petunjuk latihan

  • Definisikan X dan y menggunakan data dan target, masing-masing.
  • Buat X_train dan y_train sebagai 300 sampel pertama dari X dan y, masing-masing, dengan menggunakan X[:300] untuk X_train.
  • Buat X_test dan y_test sebagai sisa dari X dan y, masing-masing (kecuali 300 sampel pertama tersebut), dengan menggunakan X[300:] untuk X_test.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Define X and y 
X = cancer_data.____
y = cancer_data.____

# Define training and testing data
X_train = X[____]
X_test = X[____]
y_train = y[____]
y_test = y[____] 
Edit dan Jalankan Kode