Algoritmos de PySpark MLlib
Antes de utilizar cualquier algoritmo de machine learning en el terminal PySpark, tendrás que importar los submódulos de la biblioteca pyspark.mllib
y, a continuación, elegir la clase adecuada para una tarea específica de machine learning.
En este sencillo ejercicio aprenderás a importar los distintos submódulos de pyspark.mllib
junto con las clases necesarias para usar los algoritmos de filtrado colaborativo, clasificación y agrupamiento.
Este ejercicio forma parte del curso
Fundamentos de big data con PySpark
Instrucciones del ejercicio
- Importa el submódulo de recomendación
pyspark.mllib
y la clase Mínimos cuadrados alternantes. - Importa el submódulo de clasificación
pyspark.mllib
y la regresión logística con la clase LBFGS. - Importa el submódulo de agrupamiento
pyspark.mllib
y la clase kmeans.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Import the library for ALS
from pyspark.mllib.____ import ____
# Import the library for Logistic Regression
from ____.____.____ import ____
# Import the library for Kmeans
from ____.____.____ ____ ____