1. Nauka
  2. /
  3. Kursy
  4. /
  5. Prywatność danych i anonimizacja w Pythonie

Connected

ćwiczenie

Kodowanie górne i dolne wynagrodzeń w Białym Domu

Kodowanie górne i dolne pozwala ukryć wartości odstające i zmniejszyć ryzyko identyfikacji bez uszczerbku dla użyteczności danych.

W tym ćwiczeniu wykorzystasz dane o wynagrodzeniach pracowników amerykańskiego Białego Domu z lat 2019 i 2020. Zastosuj technikę kodowania górnego i dolnego dla kolumny salary.

Zacznij od zbadania wynagrodzeń i sprawdzenia, gdzie skupia się większość wartości w rozkładzie. Na podstawie tej analizy wybierz odpowiednie wartości kodowania górnego i dolnego.

Zbiór danych jest wczytany jako wh2020.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Utwórz histogram, aby zobaczyć rozkład wynagrodzeń w kolumnie salary. Użyj domyślnych wartości przedziałów.