1. Learn
  2. /
  3. Cursuri
  4. /
  5. Curățarea datelor în Python

Connected

exercițiu

Urmărește banii

În acest exercițiu, lucrezi cu o altă versiune a DataFrame-ului banking, care conține valori lipsă atât în coloana cust_id, cât și în coloana acct_amount.

Vrei să realizezi o analiză privind numărul de clienți unici ai băncii, suma medie deținută de clienți și altele. Știi că rândurile cu cust_id lipsă nu îți sunt de folos și că, în medie, acct_amount este de obicei de 5 ori valoarea inv_amount.

În acest exercițiu, vei elimina rândurile din banking cu cust_id lipsă și vei imputa valorile lipsă ale acct_amount folosind cunoștințe din domeniu.

Instrucțiuni

100 XP
  • Folosește .dropna() pentru a elimina valorile lipsă din coloana cust_id din banking și stochează rezultatele în banking_fullid.
  • Folosește inv_amount pentru a calcula sumele estimate ale conturilor pentru banking_fullid, setând valorile egale cu inv_amount * 5, și atribuie rezultatele variabilei acct_imp.
  • Imputează valorile lipsă ale acct_amount din banking_fullid cu acct_imp nou creat, folosind .fillna().