1. Learn
  2. /
  3. Cursuri
  4. /
  5. Confidențialitatea datelor și anonimizarea în Python

Connected

exercițiu

Codificarea superioară și inferioară a salariilor de la Casa Albă

Codificarea superioară și inferioară ne permite să ascundem valorile extreme și să reducem riscul de identificare, fără a diminua utilitatea datelor.

În acest exercițiu, vei folosi date despre salariile din Casa Albă a SUA pentru anii 2019 și 2020. Aplică tehnica de codificare superioară și inferioară pentru coloana salary.

Vei începe prin a explora salariile și a observa cum se concentrează cea mai mare parte a valorilor în centrul distribuției. Pe baza acestei explorări, vei alege valori rezonabile pentru codificarea superioară și inferioară.

DataFrame-ul este încărcat ca wh2020.

Instrucțiuni 1/4

undefined XP
    1
    2
    3
    4
  • Creează o histogramă pentru a vizualiza distribuția salariilor din coloana salary. Folosește valorile implicite pentru intervale.