Skalowanie standardowe

Skalowanie standardowe przekształca cechy numeryczne tak, aby miały średnią równą 0 i wariancję równą 1. W tym ćwiczeniu wykonasz skalowanie standardowe za pomocą StandardScaler() z biblioteki sklearn. Najpierw wybierzesz tylko odpowiednie kolumny do skalowania – posłuży do tego kombinacja filtrowania kolumn numerycznych oraz wiedzy o strukturze danych. Filtrowanie jest już przygotowane i opiera się na wyrażeniach regularnych, które umożliwiają dopasowywanie częściowych ciągów znaków. Następnie użyjesz metody fit_transform(), aby przekształcić wybrane kolumny.

Moduł pandas jest dostępny jako pd, a przykładowy DataFrame załadowany jako df. Kolumna hour jest już skonwertowana do typu datetime, a StandardScaler z sklearn.preprocessing jest dostępny w środowisku.

Wybierz kolumny numeryczne i przefiltruj podany filter_cols za pomocą .select_dtypes().
Zastosuj skalowanie standardowe do odpowiednich kolumn: najpierw utwórz obiekt StandardScaler(), a następnie użyj metody .fit_transform().
Wyświetl wariancję nowo przekształconych kolumn, korzystając z .var().

ćwiczenie

Skalowanie standardowe

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie