1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wykrywanie anomalii w Pythonie

Connected

ćwiczenie

Testowanie QuantileTransformer

Standaryzacja jest podatna na te same problemy co wyniki z. Obie metody korzystają ze średniej i odchylenia standardowego, przez co są bardzo wrażliwe na wartości ekstremalne.

Aby ominąć ten problem, warto użyć QuantileTransformer, który opiera się na kwantylach. Kwantyle rozkładu pozostają niezmienne niezależnie od wielkości wartości odstających.

StandardScaler sprawdza się najlepiej, gdy dane mają rozkład normalny (co można sprawdzić za pomocą histogramu). Dla innych rozkładów lepszym wyborem jest QuantileTransformer.

Ćwiczenie wykonasz na wczytanym zbiorze danych females. Biblioteka matplotlib.pyplot jest wczytana pod standardowym aliasem plt.

Instrukcje

100 XP
  • Utwórz instancję QuantileTransformer(), która przekształca cechy do rozkładu normalnego, i przypisz ją do qt.
  • Dopasuj i przekształć tablicę cech X, zachowując nazwy kolumn.
  • Narysuj histogram kolumny palmlength.