MulaiMulai sekarang secara gratis

Latih pohon klasifikasi pertama Anda

Dalam latihan ini, Anda akan bekerja dengan Wisconsin Breast Cancer Dataset dari repositori Machine Learning UCI. Anda akan memprediksi apakah suatu tumor bersifat ganas (malignant) atau jinak (benign) berdasarkan dua fitur: rata-rata jari-jari tumor (radius_mean) dan rata-rata jumlah titik cekungnya (concave points_mean).

Himpunan data sudah dimuat di ruang kerja Anda dan telah dibagi menjadi 80% latih dan 20% uji. Matriks fitur ditempatkan pada X_train dan X_test, sedangkan larik label ditempatkan pada y_train dan y_test dengan kelas 1 mewakili tumor ganas dan kelas 0 mewakili tumor jinak. Untuk memperoleh hasil yang dapat direproduksi, kami juga mendefinisikan variabel bernama SEED yang disetel ke 1.

Latihan ini adalah bagian dari kursus

Machine Learning dengan Model Berbasis Pohon di Python

Lihat Kursus

Petunjuk latihan

  • Impor DecisionTreeClassifier dari sklearn.tree.

  • Instansiasi DecisionTreeClassifier dt dengan kedalaman maksimum sama dengan 6.

  • Latih (fit) dt pada himpunan latih.

  • Prediksi label himpunan uji dan simpan hasilnya ke y_pred.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import DecisionTreeClassifier from sklearn.tree
from ____.____ import ____

# Instantiate a DecisionTreeClassifier 'dt' with a maximum depth of 6
dt = ____(____=____, random_state=SEED)

# Fit dt to the training set
____.____(____, ____)

# Predict test set labels
y_pred = ____.____(____)
print(y_pred[0:5])
Edit dan Jalankan Kode