or
Este ejercicio forma parte del curso
En este capítulo explorarás qué es la ingeniería de características y cómo empezar a aplicarla a datos del mundo real. Cargarás, explorarás y visualizarás un conjunto de respuestas de una encuesta, y así conocerás sus tipos de datos subyacentes y por qué influyen en cómo debes diseñar tus características. Usando el paquete pandas, crearás nuevas características a partir de columnas tanto categóricas como continuas.
Este capítulo te presenta la realidad de los datos desordenados e incompletos. Aprenderás a detectar dónde tu data tiene valores ausentes y explorarás varias formas de tratarlos. También usarás técnicas de manipulación de cadenas para eliminar caracteres no deseados en tu conjunto de datos.
En este capítulo te centrarás en analizar la distribución subyacente de tus datos y si puede afectar a tu flujo de trabajo de Machine Learning. Aprenderás a tratar datos asimétricos y situaciones en las que los valores atípicos pueden estar afectando negativamente a tu análisis.
Por último, en este capítulo trabajarás con datos de texto no estructurados para entender cómo puedes crear características en columnas a partir de un corpus de texto. Compararás cómo distintos enfoques influyen en la cantidad de contexto que se extrae del texto y cómo equilibrar la necesidad de contexto sin generar demasiadas características.
Ejercicio actual