1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Čištění dat v R

Connected

cvičení

Práce s chybějícími daty

V tomto cvičení pracuješ s další verzí dat accounts, která obsahuje chybějící hodnoty ve sloupcích cust_id i acct_amount.

Chceš zjistit, kolik jedinečných zákazníků banka má, a také jaká je průměrná částka na účtech. Víš, že řádky s chybějícím cust_id ti příliš nepomůžou, a že průměrná hodnota acct_amount bývá zpravidla 5násobkem hodnoty inv_amount.

V tomto cvičení odstraníš z accounts řádky s chybějícím cust_id a chybějící hodnoty inv_amount doplníš pomocí znalostí z dané domény. Balíčky dplyr a assertive jsou načteny a datová sada accounts je k dispozici.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Odfiltruj z accounts řádky s chybějícím cust_id a výsledek ulož jako accounts_clean.