Pandas-Funktionen effektiv nutzen
Du erstellst eine Python-Anwendung, die zusammenfassende Statistiken auf der Grundlage von benutzerdefinierten Variablen berechnet. Der gesamte Datensatz ist ziemlich groß. Im Moment richtest du deinen Code mit einem Teil des Datensatzes ein, der als adult vorgeladen ist. Wenn du einen wiederverwendbaren Prozess erstellst, solltest du dir überlegen, wie du das GroupBy Objekt am effizientesten einrichten kannst.
Diese Übung ist Teil des Kurses
Arbeiten mit kategorialen Daten in Python
Anleitung zur Übung
- Erstelle eine Liste mit den Namen für zwei benutzerdefinierte Variablen:
"Education"und"Above/Below 50k". - Erstelle ein
GroupByObjekt,gb, indem du dieuser_listals Gruppierungsvariablen verwendest. - Berechne den Mittelwert von
"Hours/Week"für jede Gruppe, indem du den effizientesten Ansatz aus dem Video anwendest.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a list of user-selected variables
user_list = ____
# Create a GroupBy object using this list
gb = ____
# Find the mean for the variable "Hours/Week" for each group - Be efficient!
print(____)