Laad de gegevensset
NannyML bevat een set interne gegevenssets om het makkelijker te maken om use-cases te demonstreren en verschillende algoritmen te testen. Om de gegevensset te laden, hoef je alleen de functie nannyml.load_us_census_ma_employment_data() te gebruiken.
De functie retourneert drie Pandas-DataFrame-objecten: de referentieset (de testset), de analyseset (onbeziene productiedata) en de ground truth voor de analyseset. Deze dataframes moeten volgens de conventie reference, analysis en analysis_gt heten.
In deze oefening laad je de US Census Employment-gegevensset en print je de dataframes om te zien hoe ze eruitzien.
Deze oefening maakt deel uit van de cursus
Monitoring Machine Learning in Python
Oefeninstructies
- Importeer de
nannyml-bibliotheek. - Laad de US Census Employment-gegevensset uit de
nannyml-bibliotheek. - Print de head van de referentiedata.
- Print de head van de analysedata.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import nannyml
import ____
# Load US Census Employment dataset
____, ____, ____ = ____.____()
# Print head of the reference data
____
# Print head of the analysis data
____