Penelusuran data
Untuk latihan coding, Anda akan menggunakan teori yang baru saja dipelajari dan menerapkannya pada himpunan data baru. Himpunan data ini berisi data nasabah bank dan akan digunakan untuk memprediksi apakah nasabah akan gagal bayar pinjaman mereka.
Ada fungsi-fungsi yang sangat membantu di R untuk mendapatkan gambaran umum tentang himpunan data yang Anda miliki. Untuk saat ini Anda hanya akan melihat summary() dan str().
Paket yang diperlukan sudah dimuat dan himpunan data defaultData sudah tersedia di lingkungan kerja Anda.
Latihan ini merupakan bagian dari kursus
Machine Learning untuk Analitik Pemasaran dengan R
Instruksi latihan
- Gunakan
summary()danstr()untuk meninjau data Anda. - Pastikan juga memperoleh lebih banyak wawasan tentang variabel yang diminati,
PaymentDefault, dengan membuat diagram batang dari dua levelnya.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Summary of data
___(defaultData)
# Look at data structure
___(defaultData)
# Analyze the balancedness of dependent variable
ggplot(___,aes(x = ___)) +
geom_histogram(stat = "count")