MulaiMulai sekarang secara gratis

Menghitung koefisien korelasi Pearson

Seperti disebutkan dalam video, koefisien korelasi Pearson, juga disebut Pearson r, sering kali lebih mudah ditafsirkan daripada kovarians. Nilai ini dihitung menggunakan fungsi np.corrcoef(). Seperti np.cov(), fungsi ini menerima dua larik sebagai argumen dan menghasilkan larik 2D. Entri [0,0] dan [1,1] pasti bernilai 1 (dapatkah Anda memikirkan alasannya?), dan nilai yang kita cari ada pada entri [0,1].

Dalam latihan ini, Anda akan menulis sebuah fungsi, pearson_r(x, y) yang menerima dua larik dan mengembalikan koefisien korelasi Pearson. Anda kemudian akan menggunakan fungsi ini untuk menghitungnya bagi panjang dan lebar mahkota bunga (petal) dari I. versicolor.

Sekali lagi, kami sertakan plot sebar yang Anda buat pada latihan sebelumnya untuk mengingatkan Anda bagaimana lebar dan panjang petal saling berkaitan.

Latihan ini adalah bagian dari kursus

Berpikir Statistis dengan Python (Bagian 1)

Lihat Kursus

Petunjuk latihan

  • Definisikan sebuah fungsi dengan tanda tangan pearson_r(x, y).
    • Gunakan np.corrcoef() untuk menghitung matriks korelasi dari x dan y (berikan keduanya ke np.corrcoef() dalam urutan tersebut).
    • Fungsi mengembalikan entri [0,1] dari matriks korelasi.
  • Hitung korelasi Pearson antara data dalam larik versicolor_petal_length dan versicolor_petal_width. Tetapkan hasilnya ke r.
  • Cetak hasilnya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

def ____(____, ____):
    """Compute Pearson correlation coefficient between two arrays."""
    # Compute correlation matrix: corr_mat


    # Return entry [0,1]
    return corr_mat[0,1]

# Compute Pearson correlation coefficient for I. versicolor: r


# Print the result
Edit dan Jalankan Kode