1. Learn
  2. /
  3. Cursuri
  4. /
  5. Exersează întrebări de interviu pentru Machine Learning în Python

Connected

exercițiu

Detectarea valorilor aberante

Un aspect foarte important al preprocesării corecte a datelor este detectarea valorilor aberante. În interviurile de machine learning, o întrebare frecventă este cum să localizezi și să procesezi valorile aberante. O metodă simplă de detectare este vizualizarea lor grafică.

După ce ai găsit și imputat datele lipsă, identificarea valorilor aberante și deciderea modului de tratare a acestora reprezintă un alt pas necesar în preprocesare.

Există o varietate de biblioteci care îți permit să vizualizezi valorile aberante, însă în acest exercițiu vei folosi seaborn pentru a reprezenta grafic boxplot-uri univariate și multivariate ale unor coloane selectate din loan_data.

Toate bibliotecile relevante au fost deja importate.

Unde te afli în pipeline?

Machine learning pipeline

Instrucțiuni 1/3

undefined XP
  • 1
    • Creează un boxplot univariat folosind caracteristica Annual Income din loan_data.
    • Creează un boxplot multivariat condiționat de Loan Status folosind caracteristica Annual Income din loan_data.
  • 2
    • Creează un boxplot univariat folosind caracteristica Monthly Debt din loan_data.
    • Creează un boxplot multivariat condiționat de Loan Status folosind caracteristica Monthly Debt din loan_data.
  • 3
    • Creează un boxplot univariat folosind caracteristica Years of Credit History din loan_data.
    • Creează un boxplot multivariat condiționat de Loan Status folosind caracteristica Years of Credit History din loan_data.