Erste SchritteKostenlos loslegen

Visualisierung automatisieren

Eine der größten Stärken von Matplotlib ist, dass es sich automatisch an die Daten anpassen kann, die es als Eingabe erhält. Wenn du zum Beispiel Daten mit einer unbekannten Anzahl von Kategorien erhältst, kannst du trotzdem ein Balkendiagramm erstellen, das Balken für jede Kategorie enthält.

Genau das wirst du in dieser Übung tun. Du wirst wieder Daten über die Medaillengewinner der Olympischen Sommerspiele 2016 visualisieren, aber diesmal hast du einen Datensatz, der eine unbekannte Anzahl von Sportarten enthält. Dieser wird als pandas-DataFrame-Objekt namens summer_2016_medals in den Speicher geladen, das eine Spalte namens "Sport" hat, die dir sagt, welcher Sportart jede Zeile entspricht. Es gibt auch eine "Weight"-Spalte, in der du das Gewicht der einzelnen Athleten findest.

Diese Übung ist Teil des Kurses

Einführung in die Datenvisualisierung mit Matplotlib

Kurs anzeigen

Anleitung zur Übung

  • Iteriere über die Werte von sports und setze sport als deine Schleifenvariable ein.
  • Extrahiere in jeder Iteration die Zeilen, in denen die Spalte "Sport" gleich sport ist.
  • Füge dem bereitgestellten ax-Objekt einen Balken hinzu, der mit dem Namen der Sportart beschriftet ist, mit dem Mittelwert der "Weight"-Spalte als Höhe und der Standardabweichung als Fehlerbalken auf der y-Achse.
  • Speichere die Abbildung in der Datei "sports_weights.png".

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

fig, ax = plt.subplots()

# Loop over the different sports branches
for ____ in ____:
  # Extract the rows only for this sport
  sport_df = ____
  # Add a bar for the "Weight" mean with std y error bar
  ____

ax.set_ylabel("Weight")
ax.set_xticklabels(sports, rotation=90)

# Save the figure to file
____
Bearbeiten und Ausführen von Code