Een histogram bouwen (2): bins
In de vorige oefening heb je het aantal bins niet opgegeven. In dat geval zet Python standaard het aantal bins op 10. Het aantal bins is best belangrijk. Te weinig bins vereenvoudigt de werkelijkheid en laat de details niet zien. Te veel bins maakt het onnodig complex en verdoezelt het grotere geheel.
Om het aantal bins waarmee je je data indeelt te bepalen, kun je het argument bins instellen.
Dat is precies wat je in deze oefening gaat doen. Je maakt hier twee grafieken. De code in het script bevat al aanroepen van plt.show() en plt.clf(); plt.show() toont een grafiek; plt.clf() maakt deze weer schoon, zodat je opnieuw kunt beginnen.
Net als eerder is life_exp beschikbaar en is matplotlib.pyplot geïmporteerd als plt.
Deze oefening maakt deel uit van de cursus
Python voor gemiddeld niveau
Oefeninstructies
- Bouw een histogram van
life_expmet5bins. Kun je zien welke bin de meeste observaties bevat? - Bouw nog een histogram van
life_exp, dit keer met20bins. Is dit beter?
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Build histogram with 5 bins
# Show and clean up plot
plt.show()
plt.clf()
# Build histogram with 20 bins
# Show and clean up again
plt.show()
plt.clf()