CommencerCommencer gratuitement

Tester la corrélation

Vous cherchez à savoir si les loyers à Las Vegas et à Houston sont corrélés. Si vous observez une hausse des prix à Las Vegas, est-il raisonnable de supposer qu’ils augmentent aussi à Houston ? Un tableau NumPy des loyers a été chargé pour Las Vegas (lasvegas_rents) et Houston (houston_rents), ainsi que les dates associées à chaque mesure.

Les packages pandas sous pd, NumPy sous np, Matplotlib sous plt, et le package stats de SciPy ont déjà été chargés pour vous.

Cet exercice fait partie du cours

Fondements de l’inférence en Python

Afficher le cours

Instructions

  • Créez un graphique linéaire avec deux courbes, l’une pour houston_rents et l’autre pour lasvegas_rents, en utilisant les dates sur l’axe des abscisses.
  • Calculez le coefficient de corrélation de Pearson et sa p-value associée.
  • Déterminez et affichez un booléen indiquant si la p-value est significative au seuil de 5 %.
  • Affichez le R².

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a line graph showing the rents for both San Francisco and Las Vegas
____(____, ____, label='Houston')
____(____, ____, label='Las Vegas')
plt.show()

# Compute the Pearson correlation coefficient R, as well as the p-value
r, p_value = ____(____, ____)

# Print if the p-value is less than alpha = 5%
____

# Print out R-squared
____
Modifier et exécuter le code