1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przewidywanie CTR z użyciem uczenia maszynowego w Pythonie

Connected

ćwiczenie

Skalowanie standardowe

Skalowanie standardowe przekształca cechy numeryczne tak, aby miały średnią równą 0 i wariancję równą 1. W tym ćwiczeniu wykonasz skalowanie standardowe za pomocą StandardScaler() z biblioteki sklearn. Najpierw wybierzesz tylko odpowiednie kolumny do skalowania – posłuży do tego kombinacja filtrowania kolumn numerycznych oraz wiedzy o strukturze danych. Filtrowanie jest już przygotowane i opiera się na wyrażeniach regularnych, które umożliwiają dopasowywanie częściowych ciągów znaków. Następnie użyjesz metody fit_transform(), aby przekształcić wybrane kolumny.

Moduł pandas jest dostępny jako pd, a przykładowy DataFrame załadowany jako df. Kolumna hour jest już skonwertowana do typu datetime, a StandardScaler z sklearn.preprocessing jest dostępny w środowisku.

Instrukcje

100 XP
  • Wybierz kolumny numeryczne i przefiltruj podany filter_cols za pomocą .select_dtypes().
  • Zastosuj skalowanie standardowe do odpowiednich kolumn: najpierw utwórz obiekt StandardScaler(), a następnie użyj metody .fit_transform().
  • Wyświetl wariancję nowo przekształconych kolumn, korzystając z .var().