1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Čištění dat v Pythonu

Connected

Cvičení

Sleduj peníze

V tomto cvičení pracuješ s další verzí DataFrame banking, která obsahuje chybějící hodnoty ve sloupci cust_id i ve sloupci acct_amount.

Chceš zjistit, kolik unikátních zákazníků banka má, jaký je průměrný zůstatek na účtech a podobně. Víš, že řádky s chybějícím cust_id ti k ničemu nejsou a že acct_amount je zpravidla 5× vyšší než inv_amount.

V tomto cvičení odstraníš řádky DataFrame banking s chybějícím cust_id a chybějící hodnoty acct_amount doplníš pomocí znalosti domény.

Pokyny

100 XP
  • Pomocí .dropna() odstraň chybějící hodnoty ve sloupci cust_id z DataFrame banking a výsledek ulož do banking_fullid.
  • Pomocí inv_amount vypočítej odhadované zůstatky na účtech pro banking_fullid tak, že hodnoty nastavíš na inv_amount * 5, a výsledek přiřaď do acct_imp.
  • Chybějící hodnoty acct_amount v banking_fullid doplň nově vytvořeným acct_imp pomocí .fillna().