LoslegenKostenlos loslegen

Ausreißererkennung

Ein sehr wichtiger Aspekt der korrekten Datenvorverarbeitung ist die Erkennung von Ausreißern. In Vorstellungsgesprächen zum Thema Machine Learning wird häufig gefragt, wie man Ausreißer findet und verarbeitet. Eine einfache Methode, Ausreißer zu erkennen, ist ihre grafische Darstellung.

Nachdem du fehlende Werte gefunden und imputiert hast, ist das Finden von Ausreißern und die Entscheidung, wie du damit umgehst, ein weiterer notwendiger Schritt der Vorverarbeitung.

Es gibt eine Reihe von Paketen, mit denen du Ausreißer visualisieren kannst. In dieser Übung verwendest du seaborn, um univariate und multivariate Boxplots ausgewählter Spalten von loan_data zu zeichnen.

Alle relevanten Pakete wurden bereits für dich importiert.

Wo befindest du dich in der Pipeline?

Machine learning pipeline

Diese Übung ist Teil des Kurses

ML-Vorstellungsgespräche in Python üben

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import modules
import matplotlib.pyplot as plt
import seaborn as sns

# Univariate and multivariate boxplots
fig, ax =plt.subplots(1,2)
sns.____(y=____['_____'], ax=ax[0])
sns.____(x='Loan Status', y='Annual Income', data=____, ax=ax[1])
plt.show()
Code bearbeiten und ausführen