MulaiMulai sekarang secara gratis

Penelusuran data

Untuk latihan coding, Anda akan menggunakan teori yang baru saja dipelajari dan menerapkannya pada himpunan data baru. Himpunan data ini berisi data nasabah bank dan akan digunakan untuk memprediksi apakah nasabah akan gagal bayar pinjaman mereka.

Ada fungsi-fungsi yang sangat membantu di R untuk mendapatkan gambaran umum tentang himpunan data yang Anda miliki. Untuk saat ini Anda hanya akan melihat summary() dan str().

Paket yang diperlukan sudah dimuat dan himpunan data defaultData sudah tersedia di lingkungan kerja Anda.

Latihan ini adalah bagian dari kursus

Machine Learning untuk Analitik Pemasaran dengan R

Lihat Kursus

Petunjuk latihan

  • Gunakan summary() dan str() untuk meninjau data Anda.
  • Pastikan juga memperoleh lebih banyak wawasan tentang variabel yang diminati, PaymentDefault, dengan membuat diagram batang dari dua levelnya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Summary of data
___(defaultData)

# Look at data structure
___(defaultData)

# Analyze the balancedness of dependent variable
ggplot(___,aes(x = ___)) +
  geom_histogram(stat = "count") 
Edit dan Jalankan Kode