Tester la corrélation
Vous cherchez à savoir si les loyers à Las Vegas et à Houston sont corrélés. Si vous observez une hausse des prix à Las Vegas, est-il raisonnable de supposer qu’ils augmentent aussi à Houston ? Un tableau NumPy des loyers a été chargé pour Las Vegas (lasvegas_rents) et Houston (houston_rents), ainsi que les dates associées à chaque mesure.
Les packages pandas sous pd, NumPy sous np, Matplotlib sous plt, et le package stats de SciPy ont déjà été chargés pour vous.
Cet exercice fait partie du cours
Fondements de l’inférence en Python
Instructions
- Créez un graphique linéaire avec deux courbes, l’une pour
houston_rentset l’autre pourlasvegas_rents, en utilisant lesdatessur l’axe des abscisses. - Calculez le coefficient de corrélation de Pearson et sa p-value associée.
- Déterminez et affichez un booléen indiquant si la p-value est significative au seuil de 5 %.
- Affichez le R².
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a line graph showing the rents for both San Francisco and Las Vegas
____(____, ____, label='Houston')
____(____, ____, label='Las Vegas')
plt.show()
# Compute the Pearson correlation coefficient R, as well as the p-value
r, p_value = ____(____, ____)
# Print if the p-value is less than alpha = 5%
____
# Print out R-squared
____