ComenzarEmpieza gratis

Ingeniería de características

Tu tarea es predecir si un nuevo grupo de solicitantes de préstamos probablemente incumplirá sus pagos. Cuentas con un conjunto de datos histórico y quieres entrenar un clasificador con él. Notas que muchas características están en formato de cadena, lo cual es un problema para tus clasificadores. Por ello decides codificar numéricamente las columnas de tipo cadena usando LabelEncoder(). La función ya está precargada para ti desde el submódulo preprocessing de sklearn. El conjunto de datos credit también está precargado, al igual que una lista con todos los nombres de columnas cuyo tipo de dato es cadena, almacenada en non_numeric_columns.

Este ejercicio forma parte del curso

Diseño de flujos de trabajo de Machine Learning en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Inspect the first few lines of your data using head()
credit.____
Editar y ejecutar código