Membangun Decision Tree
Sekarang setelah Anda membagi data penerbangan menjadi himpunan latih dan uji, Anda dapat menggunakan himpunan latih untuk melatih model Decision Tree.
Data tersedia sebagai flights_train dan flights_test.
CATATAN: Proses pelatihan model akan memakan waktu beberapa detik… mohon bersabar!
Latihan ini adalah bagian dari kursus
Machine Learning dengan PySpark
Petunjuk latihan
- Impor kelas untuk membuat klasifikator Decision Tree.
- Buat objek klasifikator dan latih pada data latih.
- Buat prediksi untuk data uji dan periksa hasil prediksinya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import the Decision Tree Classifier class
from pyspark.ml.____ import ____
# Create a classifier object and fit to the training data
tree = ____()
tree_model = tree.____(____)
# Create predictions for the testing data and take a look at the predictions
prediction = tree_model.____(____)
prediction.select('label', 'prediction', 'probability').show(5, False)