Aan de slagGa gratis aan de slag

"Step"-histogram

Met histogrammen kun je de verdeling van data in verschillende groepen bekijken. In deze oefening kies je groepen uit de gegevensset met medaillewinnaars van de Olympische Zomerspelen 2016 om de lengte van medaillewinnaars in twee verschillende sporten te vergelijken.

De data staat in een pandas DataFrame genaamd summer_2016_medals met een kolom "Height". Daarnaast krijg je een pandas GroupBy-object dat gegroepeerd is op sport.

In deze oefening visualiseer en voorzie je de histogrammen van twee sporten van labels: "Gymnastics" en "Rowing", zodat je het duidelijke verschil tussen medaillewinnaars in deze twee sporten ziet.

Deze oefening maakt deel uit van de cursus

Introductie tot datavisualisatie met Matplotlib

Cursus bekijken

Oefeninstructies

  • Gebruik de methode hist om een histogram te tonen van de kolom "Weight" uit het DataFrame mens_rowing, en label dit als "Rowing".
  • Gebruik hist om een histogram te tonen van de kolom "Weight" uit het DataFrame mens_gymnastics, en label dit als "Gymnastics".
  • Gebruik voor beide histogrammen het argument histtype om de data als 'step' weer te geven en stel het aantal te gebruiken bins in op 5.
  • Voeg een legenda toe aan de figuur voordat je deze weergeeft.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

fig, ax = plt.subplots()

# Plot a histogram of "Weight" for mens_rowing
____

# Compare to histogram of "Weight" for mens_gymnastics
____

ax.set_xlabel("Weight (kg)")
ax.set_ylabel("# of observations")

# Add the legend and show the Figure
____
plt.show()
Code bewerken en uitvoeren