ComeçarComece de graça

Detecção de outliers

Um aspecto muito importante do pré-processamento correto dos seus dados é a detecção de outliers. Em entrevistas de Machine Learning, é comum perguntarem como localizar e tratar outliers. Uma maneira simples de detectar outliers é visualizá-los graficamente.

Depois de encontrar e imputar dados ausentes, identificar e decidir o que fazer com os outliers é outra etapa necessária do pré-processamento.

Há diversos pacotes que permitem visualizar outliers, mas neste exercício você usará o seaborn para plotar boxplots univariados e multivariados de colunas selecionadas de loan_data.

Todos os pacotes relevantes já foram importados para você.

Em que etapa do pipeline você está?

Machine learning pipeline

Este exercício faz parte do curso

Praticando perguntas de entrevista de Machine Learning em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import modules
import matplotlib.pyplot as plt
import seaborn as sns

# Univariate and multivariate boxplots
fig, ax =plt.subplots(1,2)
sns.____(y=____['_____'], ax=ax[0])
sns.____(x='Loan Status', y='Annual Income', data=____, ax=ax[1])
plt.show()
Editar e executar o código