Regresi logistik untuk kanker payudara
Pada latihan sebelumnya, kita melakukan evaluasi awal terhadap data. Pada latihan ini, Anda akan mendefinisikan pemisahan data pelatihan dan pengujian untuk model regresi logistik pada himpunan data kanker payudara. Ini adalah langkah awal yang penting untuk menjalankan semua model Machine Learning.
Himpunan data kanker payudara adalah contoh himpunan data dari sklearn dengan berbagai fitur dari pasien, dan nilai target berupa apakah pasien menderita kanker payudara atau tidak. Data berbentuk kamus, di mana data utama disimpan dalam array bernama data, dan nilai target disimpan dalam array bernama target. Jadi, cancer_data.data berisi fitur dan cancer_data.target berisi target. Contoh data dimuat sebagai cancer_data bersama pandas sebagai pd. LogisticRegression tersedia melalui sklearn.linear_model.
Latihan ini adalah bagian dari kursus
Memprediksi CTR dengan Machine Learning di Python
Petunjuk latihan
- Definisikan
Xdanymenggunakandatadantarget, masing-masing. - Buat
X_traindany_trainsebagai 300 sampel pertama dariXdany, masing-masing, dengan menggunakanX[:300]untukX_train. - Buat
X_testdany_testsebagai sisa dariXdany, masing-masing (kecuali 300 sampel pertama tersebut), dengan menggunakanX[300:]untukX_test.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Define X and y
X = cancer_data.____
y = cancer_data.____
# Define training and testing data
X_train = X[____]
X_test = X[____]
y_train = y[____]
y_test = y[____]