Penelusuran data
Untuk latihan coding, Anda akan menggunakan teori yang baru saja dipelajari dan menerapkannya pada himpunan data baru. Himpunan data ini berisi data nasabah bank dan akan digunakan untuk memprediksi apakah nasabah akan gagal bayar pinjaman mereka.
Ada fungsi-fungsi yang sangat membantu di R untuk mendapatkan gambaran umum tentang himpunan data yang Anda miliki. Untuk saat ini Anda hanya akan melihat summary() dan str().
Paket yang diperlukan sudah dimuat dan himpunan data defaultData sudah tersedia di lingkungan kerja Anda.
Latihan ini adalah bagian dari kursus
Machine Learning untuk Analitik Pemasaran dengan R
Petunjuk latihan
- Gunakan
summary()danstr()untuk meninjau data Anda. - Pastikan juga memperoleh lebih banyak wawasan tentang variabel yang diminati,
PaymentDefault, dengan membuat diagram batang dari dua levelnya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Summary of data
___(defaultData)
# Look at data structure
___(defaultData)
# Analyze the balancedness of dependent variable
ggplot(___,aes(x = ___)) +
geom_histogram(stat = "count")