Este ejercicio forma parte del curso
En este capítulo aprenderás qué significa exactamente preprocesar datos. Darás los primeros pasos de cualquier tarea de preprocesamiento, incluyendo la exploración de los tipos de datos y el tratamiento de los datos que faltan.
Este capítulo trata sobre la normalización de los datos. A menudo, un modelo hará algunas suposiciones sobre la distribución o la escala de tus características. La normalización es una forma de hacer que tus datos se ajusten a estos supuestos y mejorar el rendimiento del algoritmo.
En esta sección aprenderás sobre ingeniería de características. Explorarás distintas formas de crear características nuevas y más útiles a partir de las que ya existen en tu conjunto de datos. Verás cómo codificar, agregar y extraer información de características numéricas y textuales.
Este capítulo repasa algunas técnicas diferentes para seleccionar las características más importantes de tu conjunto de datos. Aprenderás a eliminar características redundantes, a trabajar con vectores de texto y a reducir el número de características de tu conjunto de datos mediante el análisis de componentes principales (PCA).
Ejercicio actual
Ahora que has aprendido todo sobre el preprocesamiento, probarás estas técnicas en un conjunto de datos que registra información sobre avistamientos de OVNIs (UFO).