Correlatie testen
Je wilt begrijpen of de huurprijzen in Las Vegas en Houston gecorreleerd zijn. Als je de prijzen in Las Vegas ziet stijgen, is het dan redelijk om aan te nemen dat ze in Houston ook stijgen? Er is een NumPy-array met huren geladen voor Las Vegas (lasvegas_rents) en Houston (houston_rents), evenals de bijbehorende dates van elke meting.
De pakketten pandas als pd, NumPy als np, Matplotlib als plt en het stats-pakket van SciPy zijn alvast voor je geladen.
Deze oefening maakt deel uit van de cursus
Basis van inferentie in Python
Oefeninstructies
- Maak een lijngrafiek met twee lijnen, één voor
houston_rentsen één voorlasvegas_rents, met dedatesop de x-as. - Bereken de Pearson-correlatiecoëfficiënt en de bijbehorende p-waarde.
- Bepaal en print een Booleaan die aangeeft of de p-waarde significant is op het 5%-niveau.
- Print R-kwadraat.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a line graph showing the rents for both San Francisco and Las Vegas
____(____, ____, label='Houston')
____(____, ____, label='Las Vegas')
plt.show()
# Compute the Pearson correlation coefficient R, as well as the p-value
r, p_value = ____(____, ____)
# Print if the p-value is less than alpha = 5%
____
# Print out R-squared
____