Gemiddelde of mediaan
Als data scientists willen we data vaak zo beknopt mogelijk beschrijven. Dan kom je uit bij de twee meest gebruikte maten van centraliteit: het gemiddelde en de mediaan. In deze oefening bekijk je een paar verschillende scenario’s en bepaal je welke maat het meest geschikt is om de data effectief te beschrijven.
Concreter: je werkt met Australische weerdata met kenmerken over temperatuur en windsnelheden. Deze gegevensset is al ingeladen als weather, en de pakketten matplotlib en pandas zijn voor je geïmporteerd als plt en pd, zodat je ze ook in de rest van dit hoofdstuk kunt gebruiken.
Deze oefening maakt deel uit van de cursus
Statistiek-vragen voor sollicitaties oefenen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Visualize the distribution
plt.hist(____)
plt.show()