LoslegenKostenlos starten

Ausreißererkennung

Ein sehr wichtiger Aspekt der korrekten Datenvorverarbeitung ist die Erkennung von Ausreißern. In Vorstellungsgesprächen zum Thema Machine Learning wird häufig gefragt, wie man Ausreißer findet und verarbeitet. Eine einfache Methode, Ausreißer zu erkennen, ist ihre grafische Darstellung.

Nachdem du fehlende Werte gefunden und imputiert hast, ist das Finden von Ausreißern und die Entscheidung, wie du damit umgehst, ein weiterer notwendiger Schritt der Vorverarbeitung.

Es gibt eine Reihe von Paketen, mit denen du Ausreißer visualisieren kannst. In dieser Übung verwendest du seaborn, um univariate und multivariate Boxplots ausgewählter Spalten von loan_data zu zeichnen.

Alle relevanten Pakete wurden bereits für dich importiert.

Wo befindest du dich in der Pipeline?

Machine learning pipeline

Diese Übung ist Teil des Kurses

<Kurs>ML-Vorstellungsgespräche in Python üben</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import modules
import matplotlib.pyplot as plt
import seaborn as sns

# Univariate and multivariate boxplots
fig, ax =plt.subplots(1,2)
sns.____(y=____['_____'], ax=ax[0])
sns.____(x='Loan Status', y='Annual Income', data=____, ax=ax[1])
plt.show()
Code bearbeiten und ausführen