Pipeline untuk memprediksi popularitas lagu
Untuk latihan terakhir, Anda akan membangun pipeline untuk imputasi nilai hilang, penskalaan fitur, dan melakukan penyetelan hyperparameter pada model logistic regression. Tujuannya adalah menemukan parameter dan akurasi terbaik saat memprediksi genre lagu!
Semua model dan objek yang diperlukan untuk membangun pipeline telah dimuatkan sebelumnya untuk Anda.
Latihan ini adalah bagian dari kursus
Supervised Learning dengan scikit-learn
Petunjuk latihan
- Buat langkah-langkah untuk pipeline dengan memanggil simple imputer, standard scaler, dan model logistic regression.
- Buat objek pipeline, lalu teruskan variabel
steps. - Instansiasi objek grid search untuk melakukan cross-validation menggunakan pipeline dan parameter.
- Cetak parameter terbaik dan hitung serta cetak skor akurasi himpunan uji untuk objek grid search.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create steps
steps = [("imp_mean", ____()),
("scaler", ____()),
("logreg", ____())]
# Set up pipeline
pipeline = ____(____)
params = {"logreg__solver": ["newton-cg", "saga", "lbfgs"],
"logreg__C": np.linspace(0.001, 1.0, 10)}
# Create the GridSearchCV object
tuning = ____(____, param_grid=____)
tuning.fit(X_train, y_train)
y_pred = tuning.predict(X_test)
# Compute and print performance
print("Tuned Logistic Regression Parameters: {}, Accuracy: {}".format(____.____, ____.____))