Menguji korelasi
Anda ingin mengetahui apakah harga sewa di Las Vegas dan Houston saling berkorelasi atau tidak. Jika Anda melihat harga naik di Las Vegas, apakah wajar berasumsi bahwa harga di Houston juga naik? Array NumPy berisi data sewa telah dimuat untuk Las Vegas (lasvegas_rents) dan Houston (houston_rents), serta dates yang terkait dengan setiap pengukuran.
Paket pandas sebagai pd, NumPy sebagai np, Matplotlib sebagai plt, dan paket stats dari SciPy telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Dasar-dasar Inferensi di Python
Petunjuk latihan
- Buat grafik garis dengan dua garis, satu untuk
houston_rentsdan satu untuklasvegas_rents, menggunakandatespada sumbu-x. - Hitung koefisien korelasi Pearson dan p-value yang terkait.
- Tentukan dan cetak nilai Boolean yang memberi tahu Anda apakah p-value signifikan pada taraf 5%.
- Cetak nilai R-squared.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a line graph showing the rents for both San Francisco and Las Vegas
____(____, ____, label='Houston')
____(____, ____, label='Las Vegas')
plt.show()
# Compute the Pearson correlation coefficient R, as well as the p-value
r, p_value = ____(____, ____)
# Print if the p-value is less than alpha = 5%
____
# Print out R-squared
____