or
Este ejercicio forma parte del curso
Spark es un marco de trabajo para trabajar con Big Data. En este capítulo se tratan algunos aspectos básicos sobre Spark y el machine learning. A continuación, descubrirás cómo conectarte a Spark utilizando Python y cargar datos CSV.
Ahora que ya sabes cómo introducir datos en Spark, pasarás a crear dos tipos de modelos de clasificación: Árboles de decisión y regresión logística. También descubrirás algunos enfoques para la preparación de datos.
A continuación, aprenderás a crear modelos de regresión lineal. También descubrirás cómo ampliar tus datos mediante la creación de nuevos predictores, así como un enfoque sólido para seleccionar solo los predictores más relevantes.
Ejercicio actual
Por último, aprenderás cómo hacer que tus modelos sean más eficientes. Descubrirás cómo utilizar las tuberías para que tu código sea más claro y fácil de mantener. A continuación, utilizarás la validación cruzada para probar mejor tus modelos y seleccionar los parámetros adecuados. Por último, te familiarizarás con dos tipos de modelos de conjunto.