1. Learn
  2. /
  3. Cursuri
  4. /
  5. Confidențialitatea datelor și anonimizarea în Python

Connected

exercițiu

Pregătirea datelor despre angajați pentru publicare în siguranță

Când lucrezi cu date reale, trebuie să te asiguri că informațiile personale ale clienților sau ale altor persoane nu pot fi urmărite sau expuse. În acest exercițiu, vei folosi o versiune simplificată a setului de date IBM HR Analytics Employee pentru a exersa tehnici de suprimare și generalizare.

Pentru a evita scurgerea de informații despre setul de date, vei înlocui numele coloanelor cu numere.

DataFrame-ul este încărcat ca hr; folosește consola pentru a-l explora. numpy este importat ca np.

Instrucțiuni 1/3

undefined XP
    1
    2
    3
  • Elimină valorile unice din hr.
  • Obține df_cleaned eliminând valorile NaN din df_dropped.