Imputación simple

Como viste en el ejercicio anterior, eliminar datos puede reducir demasiado tu conjunto de datos. En una entrevista, esto puede llevar a resultados sesgados en tu modelo de Machine Learning.

Una forma más flexible de tratar los valores ausentes es imputarlos. Hay varias maneras de hacerlo en Python, pero en este ejercicio usarás la función SimpleImputer() del módulo sklearn.impute sobre loan_data.

Después, usarás pandas y numpy para convertir el conjunto de datos imputado en un DataFrame.

Fíjate en que ahora se añaden 2 pasos a la canalización, Instantiate y Fit: Machine learning pipeline

Este ejercicio forma parte del curso

Practicing Machine Learning Interview Questions in Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import imputer module
from sklearn.impute import SimpleImputer

# Subset numeric features: numeric_cols
numeric_cols = ____.____(include=[____.____])

Editar y ejecutar código