Pipeline untuk memprediksi popularitas lagu
Untuk latihan terakhir, Anda akan membangun pipeline untuk imputasi nilai hilang, penskalaan fitur, dan melakukan penyetelan hyperparameter pada model logistic regression. Tujuannya adalah menemukan parameter dan akurasi terbaik saat memprediksi genre lagu!
Semua model dan objek yang diperlukan untuk membangun pipeline telah dimuatkan sebelumnya untuk Anda.
Latihan ini merupakan bagian dari kursus
Supervised Learning dengan scikit-learn
Instruksi latihan
- Buat langkah-langkah untuk pipeline dengan memanggil simple imputer, standard scaler, dan model logistic regression.
- Buat objek pipeline, lalu teruskan variabel
steps. - Instansiasi objek grid search untuk melakukan cross-validation menggunakan pipeline dan parameter.
- Cetak parameter terbaik dan hitung serta cetak skor akurasi himpunan uji untuk objek grid search.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create steps
steps = [("imp_mean", ____()),
("scaler", ____()),
("logreg", ____())]
# Set up pipeline
pipeline = ____(____)
params = {"logreg__solver": ["newton-cg", "saga", "lbfgs"],
"logreg__C": np.linspace(0.001, 1.0, 10)}
# Create the GridSearchCV object
tuning = ____(____, param_grid=____)
tuning.fit(X_train, y_train)
y_pred = tuning.predict(X_test)
# Compute and print performance
print("Tuned Logistic Regression Parameters: {}, Accuracy: {}".format(____.____, ____.____))