LoslegenKostenlos starten

Pandas-Funktionen effektiv nutzen

Du erstellst eine Python-Anwendung, die zusammenfassende Statistiken auf der Grundlage von benutzerdefinierten Variablen berechnet. Der gesamte Datensatz ist ziemlich groß. Im Moment richtest du deinen Code mit einem Teil des Datensatzes ein, der als adult vorgeladen ist. Wenn du einen wiederverwendbaren Prozess erstellst, solltest du dir überlegen, wie du das GroupBy Objekt am effizientesten einrichten kannst.

Diese Übung ist Teil des Kurses

<Kurs>Arbeiten mit kategorialen Daten in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erstelle eine Liste mit den Namen für zwei benutzerdefinierte Variablen: "Education" und "Above/Below 50k".
  • Erstelle ein GroupBy Objekt, gb, indem du die user_list als Gruppierungsvariablen verwendest.
  • Berechne den Mittelwert von "Hours/Week" für jede Gruppe, indem du den effizientesten Ansatz aus dem Video anwendest.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create a list of user-selected variables
user_list = ____

# Create a GroupBy object using this list
gb = ____

# Find the mean for the variable "Hours/Week" for each group - Be efficient!
print(____)
Code bearbeiten und ausführen