1. Nauka
  2. /
  3. Kursy
  4. /
  5. Prywatność danych i anonimizacja w Pythonie

Connected

ćwiczenie

Przygotowanie danych pracowników do bezpiecznego udostępnienia

Pracując z rzeczywistymi danymi, musisz zadbać o to, żeby dane osobowe klientów i innych osób nie mogły zostać odtworzone ani ujawnione. W tym ćwiczeniu skorzystasz z uproszczonej wersji zbioru danych IBM HR Analytics Employee, aby przećwiczyć techniki supresji i generalizacji.

Aby uniknąć ujawnienia informacji o zbiorze danych, zastąpisz nazwy kolumn liczbami.

DataFrame jest wczytany jako hr – użyj konsoli, żeby go zbadać. numpy jest zaimportowany jako np.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Usuń unikalne wartości z hr.
  • Uzyskaj df_cleaned, usuwając wartości NaN z df_dropped.