MulaiMulai sekarang secara gratis

Membangun Decision Tree

Sekarang setelah Anda membagi data penerbangan menjadi himpunan latih dan uji, Anda dapat menggunakan himpunan latih untuk melatih model Decision Tree.

Data tersedia sebagai flights_train dan flights_test.

CATATAN: Proses pelatihan model akan memakan waktu beberapa detik… mohon bersabar!

Latihan ini adalah bagian dari kursus

Machine Learning dengan PySpark

Lihat Kursus

Petunjuk latihan

  • Impor kelas untuk membuat klasifikator Decision Tree.
  • Buat objek klasifikator dan latih pada data latih.
  • Buat prediksi untuk data uji dan periksa hasil prediksinya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import the Decision Tree Classifier class
from pyspark.ml.____ import ____

# Create a classifier object and fit to the training data
tree = ____()
tree_model = tree.____(____)

# Create predictions for the testing data and take a look at the predictions
prediction = tree_model.____(____)
prediction.select('label', 'prediction', 'probability').show(5, False)
Edit dan Jalankan Kode