Memeriksa fitur yang berkorelasi
Sekarang Anda akan kembali ke himpunan data wine, yang terdiri dari fitur-fitur numerik kontinu. Jalankan koefisien korelasi Pearson pada himpunan data untuk menentukan kolom mana yang menjadi kandidat baik untuk dihapus. Lalu, hapus kolom-kolom tersebut dari DataFrame.
Latihan ini adalah bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Petunjuk latihan
- Cetak koefisien korelasi Pearson untuk setiap pasangan fitur dalam himpunan data
wine. - Hapus kolom apa pun dari
wineyang memiliki koefisien korelasi di atas 0,75 dengan setidaknya dua kolom lainnya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print out the column correlations of the wine dataset
print(____)
# Drop that column from the DataFrame
wine = wine.____(____, ____)
print(wine.head())