Detecção de outliers
Um aspecto muito importante do pré-processamento correto dos seus dados é a detecção de outliers. Em entrevistas de Machine Learning, é comum perguntarem como localizar e tratar outliers. Uma maneira simples de detectar outliers é visualizá-los graficamente.
Depois de encontrar e imputar dados ausentes, identificar e decidir o que fazer com os outliers é outra etapa necessária do pré-processamento.
Há diversos pacotes que permitem visualizar outliers, mas neste exercício você usará o seaborn para plotar boxplots univariados e multivariados de colunas selecionadas de loan_data.
Todos os pacotes relevantes já foram importados para você.
Em que etapa do pipeline você está?

Este exercício faz parte do curso
Praticando perguntas de entrevista de Machine Learning em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import modules
import matplotlib.pyplot as plt
import seaborn as sns
# Univariate and multivariate boxplots
fig, ax =plt.subplots(1,2)
sns.____(y=____['_____'], ax=ax[0])
sns.____(x='Loan Status', y='Annual Income', data=____, ax=ax[1])
plt.show()