MulaiMulai sekarang secara gratis

Menangani data hilang

Dalam latihan ini, Anda bekerja dengan versi lain dari data accounts yang berisi nilai hilang untuk kolom cust_id dan acct_amount.

Anda ingin mengetahui berapa banyak pelanggan unik yang dimiliki bank, serta rata-rata jumlah dana yang dimiliki pelanggan. Anda tahu bahwa baris dengan cust_id yang hilang tidak benar-benar membantu, dan bahwa secara rata-rata, acct_amount biasanya 5 kali dari inv_amount.

Dalam latihan ini, Anda akan menghapus baris accounts dengan cust_id yang hilang, dan mengimputasi nilai inv_amount yang hilang dengan pengetahuan domain. dplyr dan assertive sudah dimuat dan accounts tersedia.

Latihan ini adalah bagian dari kursus

Membersihkan Data di R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create accounts_clean
accounts_clean <- accounts %>%
  # Filter to remove rows with missing cust_id
  ___

accounts_clean
Edit dan Jalankan Kode