Logaritmická a mocninná transformace

V předchozím cvičení jsi porovnal/a rozdělení trénovací a testovací sady datasetu loan_data. V kontextu pohovoru pro Machine Learning je to zvlášť důležité, protože pozorované rozdělení určuje, zda potřebuješ použít techniky, které posunují rozdělení příznaků směrem k normálnímu rozdělení, aby nedocházelo k porušení předpokladu normality.

V tomto cvičení použiješ logaritmickou a mocninnou transformaci z modulu scipy.stats na příznak Years of Credit History z datasetu loan_data spolu s funkcí distplot() z knihovny seaborn, která vykreslí jak rozdělení dat, tak jejich jádrový odhad hustoty.

Všechny potřebné balíčky už jsou za tebe naimportované.

Takhle vypadá tvoje aktuální pozice v pipeline:

Machine learning pipeline

1
- Vyber z loan_data sloupec 'Years of Credit History' a vykresli jeho rozdělení a jádrový odhad hustoty (kde) pomocí funkce distplot().

2
- Aplikuj logaritmickou transformaci pomocí Box-Cox transformace na cr_yrs a vykresli její rozdělení a kde.
3
- Transformuj 'Years of Credit History' pomocí Box-Cox argumentu pro odmocninnou transformaci a vykresli její rozdělení a kde.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Instrukce 1/3

cvičení