Detectie van uitschieters
Een heel belangrijk onderdeel van correcte preprocessing is het detecteren van uitschieters. In Machine Learning-sollicitaties komt vaak de vraag hoe je uitschieters opspoort en verwerkt. Een makkelijke manier om uitschieters te vinden is door ze grafisch te visualiseren.
Nadat je ontbrekende waarden hebt gevonden en ingevuld, is het vinden van uitschieters en bepalen wat je ermee doet een volgende noodzakelijke preprocessing-stap.
Er zijn verschillende pakketten om uitschieters te visualiseren, maar in deze oefening gebruik je seaborn om univariate en multivariate boxplots te maken van geselecteerde kolommen uit loan_data.
Alle relevante pakketten zijn al voor je geïmporteerd.
Waar ben je in de pipeline?

Deze oefening maakt deel uit van de cursus
Machine Learning-sollicitatievragen oefenen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import modules
import matplotlib.pyplot as plt
import seaborn as sns
# Univariate and multivariate boxplots
fig, ax =plt.subplots(1,2)
sns.____(y=____['_____'], ax=ax[0])
sns.____(x='Loan Status', y='Annual Income', data=____, ax=ax[1])
plt.show()