Latih pohon klasifikasi pertama Anda
Dalam latihan ini, Anda akan bekerja dengan Wisconsin Breast Cancer Dataset dari repositori Machine Learning UCI. Anda akan memprediksi apakah suatu tumor bersifat ganas (malignant) atau jinak (benign) berdasarkan dua fitur: rata-rata jari-jari tumor (radius_mean) dan rata-rata jumlah titik cekungnya (concave points_mean).
Himpunan data sudah dimuat di ruang kerja Anda dan telah dibagi menjadi 80% latih dan 20% uji. Matriks fitur ditempatkan pada X_train dan X_test, sedangkan larik label ditempatkan pada y_train dan y_test dengan kelas 1 mewakili tumor ganas dan kelas 0 mewakili tumor jinak. Untuk memperoleh hasil yang dapat direproduksi, kami juga mendefinisikan variabel bernama SEED yang disetel ke 1.
Latihan ini adalah bagian dari kursus
Machine Learning dengan Model Berbasis Pohon di Python
Petunjuk latihan
Impor
DecisionTreeClassifierdarisklearn.tree.Instansiasi
DecisionTreeClassifierdtdengan kedalaman maksimum sama dengan 6.Latih (
fit)dtpada himpunan latih.Prediksi label himpunan uji dan simpan hasilnya ke
y_pred.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import DecisionTreeClassifier from sklearn.tree
from ____.____ import ____
# Instantiate a DecisionTreeClassifier 'dt' with a maximum depth of 6
dt = ____(____=____, random_state=SEED)
# Fit dt to the training set
____.____(____, ____)
# Predict test set labels
y_pred = ____.____(____)
print(y_pred[0:5])