CommencerCommencer gratuitement

Détection des valeurs aberrantes

Un aspect essentiel d’un bon prétraitement des données est la détection des valeurs aberrantes. En entretien Machine Learning, on vous demande souvent comment les repérer et les traiter. Une manière simple de les détecter consiste à les visualiser graphiquement.

Après avoir identifié et imputé les valeurs manquantes, repérer les valeurs aberrantes et décider comment les gérer est une autre étape indispensable du prétraitement.

Il existe plusieurs bibliothèques pour visualiser les valeurs aberrantes, mais dans cet exercice, vous allez utiliser seaborn pour tracer des boxplots univariés et multivariés de certaines colonnes de loan_data.

Tous les packages nécessaires ont déjà été importés pour vous.

Où en êtes-vous dans le pipeline ?

Machine learning pipeline

Cet exercice fait partie du cours

S’entraîner aux questions d’entretien en Machine Learning avec Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import modules
import matplotlib.pyplot as plt
import seaborn as sns

# Univariate and multivariate boxplots
fig, ax =plt.subplots(1,2)
sns.____(y=____['_____'], ax=ax[0])
sns.____(x='Loan Status', y='Annual Income', data=____, ax=ax[1])
plt.show()
Modifier et exécuter le code