CommencerCommencer gratuitement

Visualiser les variables en dérive

Après avoir classé les résultats univariés, vous savez que les variables hotel et country en dérive impactent le plus les performances du modèle. Dans cet exercice, vous allez examiner leurs résultats de dérive et leurs graphiques de distribution afin d’identifier la cause racine du problème.

Les résultats du calculateur de dérive univariée sont stockés dans la variable uv_results.

Cet exercice fait partie du cours

Surveiller le Machine Learning en Python

Afficher le cours

Instructions

  • Définissez l’argument de période sur analysis pour drift_results.
  • Passez hotel et country à column_names pour drift_results.
  • Définissez l’argument kind dans la méthode .plot() sur "drift".
  • Faites de même pour distribution_results, sauf que l’argument kind dans la méthode .plot() doit être défini sur "distribution".

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Filter and create drift plots
drift_results = uv_results.filter(
    period=____,
    column_names=[____, ____]
    ).plot(kind=____)

# Filter and create distribution plots
distribution_results = uv_results.filter(
    period=____,
    column_names=[____, ____]
    ).plot(kind=____)

# Show the plots
drift_results.show()
distribution_results.show()
Modifier et exécuter le code