Aan de slagGa gratis aan de slag

Correlatie testen

Je wilt begrijpen of de huurprijzen in Las Vegas en Houston gecorreleerd zijn. Als je de prijzen in Las Vegas ziet stijgen, is het dan redelijk om aan te nemen dat ze in Houston ook stijgen? Er is een NumPy-array met huren geladen voor Las Vegas (lasvegas_rents) en Houston (houston_rents), evenals de bijbehorende dates van elke meting.

De pakketten pandas als pd, NumPy als np, Matplotlib als plt en het stats-pakket van SciPy zijn alvast voor je geladen.

Deze oefening maakt deel uit van de cursus

Basis van inferentie in Python

Cursus bekijken

Oefeninstructies

  • Maak een lijngrafiek met twee lijnen, één voor houston_rents en één voor lasvegas_rents, met de dates op de x-as.
  • Bereken de Pearson-correlatiecoëfficiënt en de bijbehorende p-waarde.
  • Bepaal en print een Booleaan die aangeeft of de p-waarde significant is op het 5%-niveau.
  • Print R-kwadraat.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a line graph showing the rents for both San Francisco and Las Vegas
____(____, ____, label='Houston')
____(____, ____, label='Las Vegas')
plt.show()

# Compute the Pearson correlation coefficient R, as well as the p-value
r, p_value = ____(____, ____)

# Print if the p-value is less than alpha = 5%
____

# Print out R-squared
____
Code bewerken en uitvoeren