CommencerCommencez gratuitement

Tester la corrélation

Vous cherchez à savoir si les loyers à Las Vegas et à Houston sont corrélés. Si vous observez une hausse des prix à Las Vegas, est-il raisonnable de supposer qu’ils augmentent aussi à Houston ? Un tableau NumPy des loyers a été chargé pour Las Vegas (lasvegas_rents) et Houston (houston_rents), ainsi que les dates associées à chaque mesure.

Les packages pandas sous pd, NumPy sous np, Matplotlib sous plt, et le package stats de SciPy ont déjà été chargés pour vous.

Cet exercice fait partie du cours

<cours>Fondements de l’inférence en Python</cours>
Voir le cours

Instructions de l’exercice

  • Créez un graphique linéaire avec deux courbes, l’une pour houston_rents et l’autre pour lasvegas_rents, en utilisant les dates sur l’axe des abscisses.
  • Calculez le coefficient de corrélation de Pearson et sa p-value associée.
  • Déterminez et affichez un booléen indiquant si la p-value est significative au seuil de 5 %.
  • Affichez le R².

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Create a line graph showing the rents for both San Francisco and Las Vegas
____(____, ____, label='Houston')
____(____, ____, label='Las Vegas')
plt.show()

# Compute the Pearson correlation coefficient R, as well as the p-value
r, p_value = ____(____, ____)

# Print if the p-value is less than alpha = 5%
____

# Print out R-squared
____
Modifier et exécuter le code