Seperti apa data Anda? (I)
Sejauh ini Anda berfokus pada pembuatan fitur baru dan menangani masalah dalam data Anda. Rekayasa fitur juga dapat digunakan untuk memaksimalkan data yang sudah Anda miliki dan menggunakannya dengan lebih efektif saat membuat model Machine Learning.
Banyak algoritma mungkin berasumsi bahwa data Anda berdistribusi normal, atau setidaknya semua kolom berada pada skala yang sama. Sering kali hal ini tidak terpenuhi; misalnya, satu fitur mungkin diukur dalam ribuan dolar, sementara fitur lain berupa jumlah tahun. Dalam latihan ini, Anda akan membuat plot untuk menelaah sebaran beberapa kolom numerik dalam DataFrame so_survey_df, yang disimpan dalam so_numeric_df.
Latihan ini adalah bagian dari kursus
Rekayasa Fitur untuk Machine Learning di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a histogram
____
plt.show()