1. Learn
  2. /
  3. Kurser
  4. /
  5. Inżynieria cech w uczeniu maszynowym w Pythonie

Connected

övning

Podział wartości na przedziały

W przypadku wielu wartości ciągłych rzadko zależy nam na dokładnej wartości kolumny numerycznej – ważniejsze jest to, do którego przedziału dana wartość należy. Takie podejście przydaje się podczas wizualizacji danych lub upraszczania modeli uczenia maszynowego. Stosuje się je głównie dla zmiennych ciągłych, gdzie precyzja nie jest kluczowa – na przykład wiek, wzrost czy wynagrodzenie.

Przedziały tworzy się za pomocą pd.cut(df['column_name'], bins), gdzie bins może być liczbą całkowitą określającą liczbę równych przedziałów lub listą granic przedziałów.

Instruktioner 1/2

undefined XP
  • 1

    Podziel wartości kolumny ConvertedSalary w zbiorze so_survey_df na 5 równych przedziałów i zapisz wynik w nowej kolumnie o nazwie equal_binned.

  • 2

    Podziel kolumnę ConvertedSalary na przedziały wyznaczone przez granice z listy bins i nadaj im etykiety zdefiniowane w labels.