Gecorreleerde data in de natuur
Je krijgt een array grains met de breedte en lengte van graanmonsters. Je vermoedt dat breedte en lengte gecorreleerd zijn. Bevestig dit door een scatterplot van breedte versus lengte te maken en hun Pearson-correlatie te meten.
Deze oefening maakt deel uit van de cursus
Unsupervised Learning in Python
Oefeninstructies
- Importeer:
matplotlib.pyplotalsplt.pearsonruitscipy.stats.
- Wijs kolom
0vangrainstoe aanwidthen kolom1vangrainsaanlength. - Maak een scatterplot met
widthop de x-as enlengthop de y-as. - Gebruik de functie
pearsonr()om de Pearson-correlatie vanwidthenlengthte berekenen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Perform the necessary imports
____
____
# Assign the 0th column of grains: width
width = ____
# Assign the 1st column of grains: length
length = ____
# Scatter plot width vs length
plt.scatter(____, ____)
plt.axis('equal')
plt.show()
# Calculate the Pearson correlation
correlation, pvalue = ____
# Display the correlation
print(correlation)