Driftende features visualiseren
Na het rangschikken van de univariate resultaten weet je dat de drift in de features hotel en country de modelprestatie het meest beïnvloedt. In deze oefening bekijk je de driftresultaten en verdelingsplots daarvan om de onderliggende oorzaak van het probleem te bepalen.
De resultaten van de univariate driftcalculator zijn opgeslagen in de variabele uv_results.
Deze oefening maakt deel uit van de cursus
Monitoring Machine Learning in Python
Oefeninstructies
- Stel het argument period in op
analysisvoordrift_results. - Geef hotel en country door aan
column_namesvoordrift_results. - Stel het argument
kindin de.plot()-methode in op"drift". - Doe hetzelfde voor
distribution_results, behalve dat je het argumentkindin de.plot()-methode instelt op"distribution".
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Filter and create drift plots
drift_results = uv_results.filter(
period=____,
column_names=[____, ____]
).plot(kind=____)
# Filter and create distribution plots
distribution_results = uv_results.filter(
period=____,
column_names=[____, ____]
).plot(kind=____)
# Show the plots
drift_results.show()
distribution_results.show()