Eksik verileri ele alma
Bu egzersizde, hem cust_id hem de acct_amount sütunlarında eksik değerler bulunan accounts verisinin başka bir sürümüyle çalışıyorsun.
Bankanın kaç benzersiz müşterisi olduğunu ve müşterilerin ortalama tuttuğu tutarı bulmak istiyorsun. cust_id değeri eksik olan satırların pek işine yaramayacağını ve ortalamada acct_amount değerinin genellikle inv_amount tutarının 5 katı olduğunu biliyorsun.
Bu egzersizde, cust_id'si eksik olan accounts satırlarını düşürecek ve alan bilgisini kullanarak inv_amount'ın eksik değerlerini tahmin edeceksin. dplyr ve assertive yüklü ve accounts kullanılabilir durumda.
Bu egzersiz
R ile Veri Temizleme
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create accounts_clean
accounts_clean <- accounts %>%
# Filter to remove rows with missing cust_id
___
accounts_clean