MulaiMulai sekarang secara gratis

Memprediksi rating sebuah aplikasi

Setelah mengeksplorasi himpunan data Google apps pada latihan sebelumnya, kini mari membangun model yang memprediksi rating sebuah aplikasi berdasarkan sebagian fiturnya.

Untuk itu, Anda akan menggunakan DecisionTreeRegressor dari scikit-learn. Karena decision tree merupakan fondasi dari banyak model ensemble, menyegarkan kembali pemahaman Anda tentang cara kerjanya akan sangat bermanfaat sepanjang kursus ini.

Kita akan menggunakan MAE (mean absolute error) sebagai metrik evaluasi. Metrik ini sangat mudah diinterpretasikan karena merepresentasikan rata-rata selisih absolut antara rating aktual dan rating yang diprediksi.

Semua modul yang diperlukan telah diimpor untuk Anda. Fitur dan target tersedia pada variabel X dan y secara berurutan.

Latihan ini adalah bagian dari kursus

Metode Ensemble di Python

Lihat Kursus

Petunjuk latihan

  • Gunakan train_test_split() untuk membagi X dan y menjadi himpunan latih dan uji. Gunakan 20%, atau 0.2, sebagai ukuran uji.
  • Instansiasi DecisionTreeRegressor(), reg_dt, dengan hyperparameter berikut: min_samples_leaf = 3 dan min_samples_split = 9.
  • Latih regressor pada himpunan latih menggunakan .fit().
  • Prediksi label himpunan uji menggunakan .predict().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Split into train (80%) and test (20%) sets
X_train, X_test, y_train, y_test = ____(____, ____, ____, random_state=42)

# Instantiate the regressor
reg_dt = ____(____, ____, random_state=500)

# Fit to the training set
____

# Evaluate the performance of the model on the test set
y_pred = ____
print('MAE: {:.3f}'.format(mean_absolute_error(y_test, y_pred)))
Edit dan Jalankan Kode