Aan de slagGa gratis aan de slag

Driftende features visualiseren

Na het rangschikken van de univariate resultaten weet je dat de drift in de features hotel en country de modelprestatie het meest beïnvloedt. In deze oefening bekijk je de driftresultaten en verdelingsplots daarvan om de onderliggende oorzaak van het probleem te bepalen.

De resultaten van de univariate driftcalculator zijn opgeslagen in de variabele uv_results.

Deze oefening maakt deel uit van de cursus

Monitoring Machine Learning in Python

Cursus bekijken

Oefeninstructies

  • Stel het argument period in op analysis voor drift_results.
  • Geef hotel en country door aan column_names voor drift_results.
  • Stel het argument kind in de .plot()-methode in op "drift".
  • Doe hetzelfde voor distribution_results, behalve dat je het argument kind in de .plot()-methode instelt op "distribution".

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Filter and create drift plots
drift_results = uv_results.filter(
    period=____,
    column_names=[____, ____]
    ).plot(kind=____)

# Filter and create distribution plots
distribution_results = uv_results.filter(
    period=____,
    column_names=[____, ____]
    ).plot(kind=____)

# Show the plots
drift_results.show()
distribution_results.show()
Code bewerken en uitvoeren