Menangani data hilang
Dalam latihan ini, Anda bekerja dengan versi lain dari data accounts yang berisi nilai hilang untuk kolom cust_id dan acct_amount.
Anda ingin mengetahui berapa banyak pelanggan unik yang dimiliki bank, serta rata-rata jumlah dana yang dimiliki pelanggan. Anda tahu bahwa baris dengan cust_id yang hilang tidak benar-benar membantu, dan bahwa secara rata-rata, acct_amount biasanya 5 kali dari inv_amount.
Dalam latihan ini, Anda akan menghapus baris accounts dengan cust_id yang hilang, dan mengimputasi nilai inv_amount yang hilang dengan pengetahuan domain. dplyr dan assertive sudah dimuat dan accounts tersedia.
Latihan ini adalah bagian dari kursus
Membersihkan Data di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create accounts_clean
accounts_clean <- accounts %>%
# Filter to remove rows with missing cust_id
___
accounts_clean