1. Nauka
  2. /
  3. Kursy
  4. /
  5. Prywatność danych i anonimizacja w Pythonie

Connected

ćwiczenie

Stosowanie hierarchii dla danych kategorycznych

W tym ćwiczeniu stworzysz hierarchie i wykorzystasz je do zastosowania generalizacji danych na kolumnie bachelors ze zbioru danych US Adult Income.

Do dyspozycji masz gotowy słownik hierarchies zawierający hierarchie. Przechowuje on trzy kategorie poziomów wykształcenia: Primary, Secondary i Higher; każda zawiera listę odpowiadających im wartości z danych. Możesz swobodnie przeglądać ten słownik w konsoli interaktywnej.

Stworzysz nowy słownik, który będzie przechowywał uogólnione informacje o wykształceniu, a następnie użyjesz go do zastąpienia oryginalnych wartości.

Zbiór danych jest dostępny jako income_df.

Instrukcje

100 XP
  • Zainicjuj education_hierarchy jako pusty słownik.
  • Uzupełnij wewnętrzną pętlę, przypisując typ wykształcenia key jako wartość. Na przykład: {'Some-college': 'Higher education'}.
  • Zastosuj generalizację hierarchii wykształcenia na kolumnie bachelors, przypisując wynik do nowej kolumny bachelors_generalized.