Visualiser les variables en dérive
Après avoir classé les résultats univariés, vous savez que les variables hotel et country en dérive impactent le plus les performances du modèle. Dans cet exercice, vous allez examiner leurs résultats de dérive et leurs graphiques de distribution afin d’identifier la cause racine du problème.
Les résultats du calculateur de dérive univariée sont stockés dans la variable uv_results.
Cet exercice fait partie du cours
Surveiller le Machine Learning en Python
Instructions
- Définissez l’argument de période sur
analysispourdrift_results. - Passez hotel et country à
column_namespourdrift_results. - Définissez l’argument
kinddans la méthode.plot()sur"drift". - Faites de même pour
distribution_results, sauf que l’argumentkinddans la méthode.plot()doit être défini sur"distribution".
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Filter and create drift plots
drift_results = uv_results.filter(
period=____,
column_names=[____, ____]
).plot(kind=____)
# Filter and create distribution plots
distribution_results = uv_results.filter(
period=____,
column_names=[____, ____]
).plot(kind=____)
# Show the plots
drift_results.show()
distribution_results.show()