1. Learn
  2. /
  3. Courses
  4. /
  5. Curățarea datelor în Python

Connected

Exercise

Cât de integre sunt datele noastre?

În DataFrame-ul banking au fost îmbinate date noi care conțin detalii despre modul în care investițiile din coloana inv_amount sunt distribuite între patru fonduri: A, B, C și D.

În plus, vârsta și datele de naștere ale clienților sunt acum stocate în coloanele age, respectiv birth_date.

Vrei să înțelegi cum investesc clienții din diferite grupe de vârstă, dar mai întâi vrei să te asiguri că datele pe care le analizezi sunt corecte. Vei face acest lucru prin validarea încrucișată a valorilor din inv_amount și age față de sumele investite în diferite fonduri și față de datele de naștere ale clienților. Atât pandas, cât și datetime au fost importate ca pd, respectiv dt.

Instructions 1/2

undefined XP
  • 1
    • Găsește rândurile în care suma tuturor valorilor din fund_columns în banking este egală cu coloana inv_amount.
    • Stochează valorile din banking cu inv_amount consistent în consistent_inv, iar cele cu valori inconsistente în inconsistent_inv.
  • 2
    • Stochează data de astăzi în today și calculează manual vârstele clienților, stocând rezultatul în ages_manual.
    • Găsește toate rândurile din banking în care coloana age este egală cu ages_manual, apoi filtrează banking în consistent_ages și inconsistent_ages.