Menghitung koefisien korelasi Pearson
Seperti disebutkan dalam video, koefisien korelasi Pearson, juga disebut Pearson r, sering kali lebih mudah ditafsirkan daripada kovarians. Nilai ini dihitung menggunakan fungsi np.corrcoef(). Seperti np.cov(), fungsi ini menerima dua larik sebagai argumen dan menghasilkan larik 2D. Entri [0,0] dan [1,1] pasti bernilai 1 (dapatkah Anda memikirkan alasannya?), dan nilai yang kita cari ada pada entri [0,1].
Dalam latihan ini, Anda akan menulis sebuah fungsi, pearson_r(x, y) yang menerima dua larik dan mengembalikan koefisien korelasi Pearson. Anda kemudian akan menggunakan fungsi ini untuk menghitungnya bagi panjang dan lebar mahkota bunga (petal) dari I. versicolor.
Sekali lagi, kami sertakan plot sebar yang Anda buat pada latihan sebelumnya untuk mengingatkan Anda bagaimana lebar dan panjang petal saling berkaitan.
Latihan ini adalah bagian dari kursus
Berpikir Statistis dengan Python (Bagian 1)
Petunjuk latihan
- Definisikan sebuah fungsi dengan tanda tangan
pearson_r(x, y).- Gunakan
np.corrcoef()untuk menghitung matriks korelasi darixdany(berikan keduanya kenp.corrcoef()dalam urutan tersebut). - Fungsi mengembalikan entri
[0,1]dari matriks korelasi.
- Gunakan
- Hitung korelasi Pearson antara data dalam larik
versicolor_petal_lengthdanversicolor_petal_width. Tetapkan hasilnya ker. - Cetak hasilnya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
def ____(____, ____):
"""Compute Pearson correlation coefficient between two arrays."""
# Compute correlation matrix: corr_mat
# Return entry [0,1]
return corr_mat[0,1]
# Compute Pearson correlation coefficient for I. versicolor: r
# Print the result