Auf Korrelation testen
Du möchtest herausfinden, ob die Mietpreise in Las Vegas und Houston miteinander korreliert sind. Wenn die Preise in Las Vegas steigen, ist es plausibel anzunehmen, dass sie auch in Houston steigen? Ein NumPy-Array mit Mieten wurde für Las Vegas (lasvegas_rents) und Houston (houston_rents) geladen, ebenso die dates, die jeder Messung zugeordnet sind.
Die Pakete pandas als pd, NumPy als np, Matplotlib als plt und das stats-Paket aus SciPy wurden bereits für dich geladen.
Diese Übung ist Teil des Kurses
Grundlagen der Inferenz in Python
Anleitung zur Übung
- Erstelle ein Liniendiagramm mit zwei Linien, eine für
houston_rentsund eine fürlasvegas_rents, mit dendatesauf der x-Achse. - Berechne den Pearson-Korrelationskoeffizienten und den zugehörigen p-Wert.
- Bestimme und gib einen booleschen Wert aus, der dir sagt, ob der p-Wert auf dem 5%-Niveau signifikant ist.
- Gib R-Quadrat aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a line graph showing the rents for both San Francisco and Las Vegas
____(____, ____, label='Houston')
____(____, ____, label='Las Vegas')
plt.show()
# Compute the Pearson correlation coefficient R, as well as the p-value
r, p_value = ____(____, ____)
# Print if the p-value is less than alpha = 5%
____
# Print out R-squared
____