1. Learn
  2. /
  3. Cursuri
  4. /
  5. Analiză predictivă intermediară în Python

Connected

exercițiu

Gestionează valorile extreme prin winzorizare

Ai la dispoziție un basetable cu două variabile: "sum\_donations" și "donor\_id". "sum_donations poate conține valori extreme atunci când donatorii au contribuit cu sume excepționale. Prin urmare, vrei să winzorizezi această variabilă astfel încât cele mai mari 5% valori să fie înlocuite cu valoarea percentilei superioare de 5%.

Instrucțiuni

100 XP
  • Afișează valoarea minimă a sum_donations și verifică că este cel puțin 0. Apoi afișează valoarea maximă a sum_donations.
  • Completează percentila corespunzătoare pentru limita inferioară. Deoarece toate valorile mai mari decât 0 sunt realiste și apar frecvent, nu este necesar să înlocuiești valorile de sub percentila limitei inferioare.
  • Creează o nouă variabilă "sum_donations_winsorized" care să fie versiunea winzorizată a variabilei "sum_donations".
  • Afișează valoarea maximă a sum_donations_winsorized.