Het aantal bins in een histogram aanpassen
Het histogram dat je zojuist hebt gemaakt had tien bins. Dit is de default in matplotlib. De "vierkantswortelregel" is een veelgebruikte vuistregel voor het kiezen van het aantal bins: kies het aantal bins gelijk aan de vierkantswortel van het aantal steekproeven. Plot het histogram van de bloembladlengtes van Iris versicolor nogmaals, dit keer met de vierkantswortelregel voor het aantal bins. Je geeft het aantal bins op met het keyword-argument bins van plt.hist().
De plottinghulpmiddelen zijn al geïmporteerd en de seaborn-standaarden zijn al ingesteld. De variabele versicolor_petal_length bevat een array met bloembladlengtes en staat al in je namespace.
Deze oefening maakt deel uit van de cursus
Statistisch denken in Python (deel 1)
Oefeninstructies
- Importeer
numpyalsnp. Dit geeft je toegang tot de vierkantswortelfunctie,np.sqrt(). - Bepaal met
len()hoeveel datapunten je hebt. - Bereken het aantal bins met de vierkantswortelregel.
- Zet het aantal bins om naar een geheel getal met de ingebouwde functie
int(). - Maak het histogram en zorg dat je het keyword-argument
binsgebruikt. - Klik op Antwoord verzenden om de figuur te plotten en het resultaat van je werk te zien!
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import numpy
# Compute number of data points: n_data
# Number of bins is the square root of number of data points: n_bins
# Convert number of bins to integer: n_bins
# Plot the histogram
# Label axes
_ = plt.xlabel('petal length (cm)')
_ = plt.ylabel('count')
# Show histogram
plt.show()