1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Detekce anomálií v Pythonu

Connected

cvičení

Testování QuantileTransformer

Standardizace trpí stejnými nedostatky jako z-skóre. Obě metody pracují s průměrem a směrodatnou odchylkou, což je činí velmi citlivými na extrémní hodnoty.

Tento problém řeší QuantileTransformer, který využívá kvantily. Kvantily rozdělení zůstávají stejné bez ohledu na velikost odlehlých hodnot.

StandardScaler je vhodný tehdy, když mají data normální rozdělení (to lze ověřit histogramem). Pro ostatní typy rozdělení je lepší volbou QuantileTransformer.

Procvičíš si to na načteném datasetu females. Knihovna matplotlib.pyplot je načtena pod standardním aliasem plt.

Pokyny

100 XP
  • Vytvoř instanci QuantileTransformer(), která transformuje příznaky na normální rozdělení, a přiřaď ji do proměnné qt.
  • Fituj a transformuj pole příznaků X a zachovej přitom názvy sloupců.
  • Vykresli histogram sloupce palmlength.