Membangun Decision Tree
Sekarang setelah Anda membagi data penerbangan menjadi himpunan latih dan uji, Anda dapat menggunakan himpunan latih untuk melatih model Decision Tree.
Data tersedia sebagai flights_train dan flights_test.
CATATAN: Proses pelatihan model akan memakan waktu beberapa detik… mohon bersabar!
Latihan ini merupakan bagian dari kursus
Machine Learning dengan PySpark
Instruksi latihan
- Impor kelas untuk membuat klasifikator Decision Tree.
- Buat objek klasifikator dan latih pada data latih.
- Buat prediksi untuk data uji dan periksa hasil prediksinya.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Import the Decision Tree Classifier class
from pyspark.ml.____ import ____
# Create a classifier object and fit to the training data
tree = ____()
tree_model = tree.____(____)
# Create predictions for the testing data and take a look at the predictions
prediction = tree_model.____(____)
prediction.select('label', 'prediction', 'probability').show(5, False)