Auf Korrelation testen
Du möchtest herausfinden, ob die Mietpreise in Las Vegas und Houston miteinander korreliert sind. Wenn die Preise in Las Vegas steigen, ist es plausibel anzunehmen, dass sie auch in Houston steigen? Ein NumPy-Array mit Mieten wurde für Las Vegas (lasvegas_rents) und Houston (houston_rents) geladen, ebenso die dates, die jeder Messung zugeordnet sind.
Die Pakete pandas als pd, NumPy als np, Matplotlib als plt und das stats-Paket aus SciPy wurden bereits für dich geladen.
Diese Übung ist Teil des Kurses
<Kurs>Grundlagen der Inferenz in Python</Kurs>Übungsanweisungen
- Erstelle ein Liniendiagramm mit zwei Linien, eine für
houston_rentsund eine fürlasvegas_rents, mit dendatesauf der x-Achse. - Berechne den Pearson-Korrelationskoeffizienten und den zugehörigen p-Wert.
- Bestimme und gib einen booleschen Wert aus, der dir sagt, ob der p-Wert auf dem 5%-Niveau signifikant ist.
- Gib R-Quadrat aus.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create a line graph showing the rents for both San Francisco and Las Vegas
____(____, ____, label='Houston')
____(____, ____, label='Las Vegas')
plt.show()
# Compute the Pearson correlation coefficient R, as well as the p-value
r, p_value = ____(____, ____)
# Print if the p-value is less than alpha = 5%
____
# Print out R-squared
____