1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Procvičování otázek k pohovorům z oblasti Machine Learning v Pythonu

Connected

cvičení

Logaritmická a mocninná transformace

V předchozím cvičení jsi porovnal/a rozdělení trénovací a testovací sady datasetu loan_data. V kontextu pohovoru pro Machine Learning je to zvlášť důležité, protože pozorované rozdělení určuje, zda potřebuješ použít techniky, které posunují rozdělení příznaků směrem k normálnímu rozdělení, aby nedocházelo k porušení předpokladu normality.

V tomto cvičení použiješ logaritmickou a mocninnou transformaci z modulu scipy.stats na příznak Years of Credit History z datasetu loan_data spolu s funkcí distplot() z knihovny seaborn, která vykreslí jak rozdělení dat, tak jejich jádrový odhad hustoty.

Všechny potřebné balíčky už jsou za tebe naimportované.

Takhle vypadá tvoje aktuální pozice v pipeline:

Machine learning pipeline

Instrukce 1/3

undefined XP
  • 1
    • Vyber z loan_data sloupec 'Years of Credit History' a vykresli jeho rozdělení a jádrový odhad hustoty (kde) pomocí funkce distplot().
  • 2
    • Aplikuj logaritmickou transformaci pomocí Box-Cox transformace na cr_yrs a vykresli její rozdělení a kde.
  • 3
    • Transformuj 'Years of Credit History' pomocí Box-Cox argumentu pro odmocninnou transformaci a vykresli její rozdělení a kde.