LoslegenKostenlos loslegen

Auf Korrelation testen

Du möchtest herausfinden, ob die Mietpreise in Las Vegas und Houston miteinander korreliert sind. Wenn die Preise in Las Vegas steigen, ist es plausibel anzunehmen, dass sie auch in Houston steigen? Ein NumPy-Array mit Mieten wurde für Las Vegas (lasvegas_rents) und Houston (houston_rents) geladen, ebenso die dates, die jeder Messung zugeordnet sind.

Die Pakete pandas als pd, NumPy als np, Matplotlib als plt und das stats-Paket aus SciPy wurden bereits für dich geladen.

Diese Übung ist Teil des Kurses

Grundlagen der Inferenz in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle ein Liniendiagramm mit zwei Linien, eine für houston_rents und eine für lasvegas_rents, mit den dates auf der x-Achse.
  • Berechne den Pearson-Korrelationskoeffizienten und den zugehörigen p-Wert.
  • Bestimme und gib einen booleschen Wert aus, der dir sagt, ob der p-Wert auf dem 5%-Niveau signifikant ist.
  • Gib R-Quadrat aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a line graph showing the rents for both San Francisco and Las Vegas
____(____, ____, label='Houston')
____(____, ____, label='Las Vegas')
plt.show()

# Compute the Pearson correlation coefficient R, as well as the p-value
r, p_value = ____(____, ____)

# Print if the p-value is less than alpha = 5%
____

# Print out R-squared
____
Code bearbeiten und ausführen