Estimasi kinerja untuk prediksi tip
Pada latihan sebelumnya, Anda telah menyiapkan himpunan referensi dan analisis untuk himpunan data NYC Green Taxi. Pada latihan ini, Anda akan menggunakan data tersebut untuk mengestimasi kinerja model di produksi.
Pertama, Anda harus menginisialisasi algoritma DLE dengan parameter yang disediakan lalu memvisualisasikan hasilnya.
Himpunan referensi dan analisis sudah dimuat dan disimpan dalam variabel reference dan analysis.
Selain itu, nannyml juga sudah diimpor.
Latihan ini adalah bagian dari kursus
Pemantauan Machine Learning dengan Python
Petunjuk latihan
- Inisialisasi algoritma DLE dengan periode potongan harian,
tip_amountsebagaiy_true, dan metrik MSE. - Fit himpunan
referenceke estimator DLE, estimasi kinerja untuk himpunan analisis, dan simpan keluarannya dalam variabelresults. - Visualisasikan hasil menggunakan metode
plot()danshow().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
estimator = nannyml.DLE(y_pred='y_pred',
timestamp_column_name='lpep_pickup_datetime',
feature_column_names=features,
chunk_period='d',
y_true='tip_amount',
metrics=['mse'])
# Fit the reference data to the DLE algorithm
estimator.____(____)
# Estimate the performance on the analysis data
results = estimator.____(____)
# Plot and show the results
____.____().____()