1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Procvičování otázek k pohovorům z oblasti Machine Learning v Pythonu

Connected

cvičení

Detekce odlehlých hodnot

Důležitou součástí správného předzpracování dat je detekce odlehlých hodnot (outlierů). Na Machine Learning pohovorech se tato otázka objevuje poměrně často – jak odlehlé hodnoty najít a jak s nimi naložit. Jedním z nejjednodušších způsobů jejich detekce je grafická vizualizace.

Poté, co jsi zpracoval/a chybějící data, je dalším nezbytným krokem v předzpracování právě odhalení odlehlých hodnot a rozhodnutí, co s nimi dělat.

Existuje celá řada balíčků pro vizualizaci odlehlých hodnot, ale v tomto cvičení použiješ seaborn k vytvoření univariátních a multivariátních boxplotů pro vybrané sloupce datasetu loan_data.

Všechny potřebné balíčky jsou již naimportované.

Kde se nacházíš v rámci pipeline?

Machine learning pipeline

Instrukce 1/3

undefined XP
  • 1
    • Vytvoř univariátní boxplot pro příznak Annual Income z datasetu loan_data.
    • Vytvoř multivariátní boxplot podmíněný proměnnou Loan Status pro příznak Annual Income z datasetu loan_data.
  • 2
    • Vytvoř univariátní boxplot pro příznak Monthly Debt z datasetu loan_data.
    • Vytvoř multivariátní boxplot podmíněný proměnnou Loan Status pro příznak Monthly Debt z datasetu loan_data.
  • 3
    • Vytvoř univariátní boxplot pro příznak Years of Credit History z datasetu loan_data.
    • Vytvoř multivariátní boxplot podmíněný proměnnou Loan Status pro příznak Years of Credit History z datasetu loan_data.