ComeçarComece de graça

Imputação simples

Como você viu no último exercício, excluir dados pode reduzir demais o seu conjunto de dados. Em uma entrevista, isso pode levar a resultados enviesados do seu modelo de Machine Learning.

Uma forma mais flexível de lidar com valores ausentes é imputá-los. Há várias maneiras de fazer isso em Python, mas, neste exercício, você vai usar a função SimpleImputer() do módulo sklearn.impute em loan_data.

Em seguida, você usará pandas e numpy para converter o conjunto de dados imputado em um DataFrame.

Note que agora 2 etapas são adicionadas ao pipeline, Instanciar e Ajustar (Fit): Pipeline de Machine Learning

Este exercício faz parte do curso

Praticando perguntas de entrevista de Machine Learning em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import imputer module
from sklearn.impute import SimpleImputer

# Subset numeric features: numeric_cols
numeric_cols = ____.____(include=[____.____])
Editar e executar o código