1. Nauka
  2. /
  3. Kursy
  4. /
  5. Czyszczenie danych w R

Connected

ćwiczenie

Obsługa brakujących danych

W tym ćwiczeniu pracujesz z inną wersją danych accounts, która zawiera brakujące wartości w kolumnach cust_id i acct_amount.

Chcesz sprawdzić, ilu unikalnych klientów ma bank, a także jaka jest średnia kwota przechowywana przez klientów. Wiesz, że wiersze z brakującym cust_id nie są przydatne w analizie, oraz że acct_amount wynosi średnio 5-krotność wartości inv_amount.

W tym ćwiczeniu usuniesz wiersze z accounts, w których brakuje cust_id, a brakujące wartości acct_amount uzupełnisz na podstawie wiedzy dziedzinowej. Biblioteki dplyr i assertive są wczytane, a zbiór danych accounts jest dostępny.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Przefiltruj accounts, aby usunąć wiersze z brakującymi wartościami cust_id, i zapisz wynik jako accounts_clean.