or
Este ejercicio forma parte del curso
¡Prepárate para simplificar conjuntos de datos grandes! Aprenderás sobre la información, cómo evaluar la importancia de las variables y practicarás la identificación de variables con poca información. Al final del capítulo, entenderás la diferencia entre selección de variables y extracción de variables —los dos enfoques para reducir la dimensionalidad—.
Aprende a identificar variables ricas en información y pobres en información mediante las proporciones de valores ausentes, la varianza y la correlación. Después, descubrirás cómo crear recetas de tidymodels para seleccionar variables usando estos indicadores de información.
El capítulo tres introduce la diferencia entre enfoques no supervisados y supervisados para la selección de variables. Repasarás cómo usar flujos de trabajo de tidymodels para construir modelos. Luego, realizarás selección supervisada de variables usando regresión lasso y modelos de random forest.
En este último capítulo, desarrollarás una fuerte intuición sobre la extracción de variables al entender cómo los componentes principales extraen y combinan la información más importante de distintas variables. Después, aprende y aplica tres tipos de extracción de variables —análisis de componentes principales (PCA), t-SNE y UMAP—. Descubre cómo puedes usar estos métodos de extracción como paso de preprocesamiento en el proceso de construcción de modelos con tidymodels.
Ejercicio actual