Algoritmos MLlib do PySpark
Antes de usar qualquer algoritmo de aprendizado de máquina no shell do PySpark, você terá que importar os submódulos da biblioteca pyspark.mllib
e, em seguida, escolher a classe apropriada necessária para uma tarefa específica de aprendizado de máquina.
Neste exercício simples, você aprenderá a importar os diferentes submódulos do pyspark.mllib
juntamente com as classes necessárias para executar os algoritmos de filtragem colaborativa, classificação e clustering.
Este exercício faz parte do curso
Fundamentos de Big Data com PySpark
Instruções de exercício
- Importe o submódulo de recomendação
pyspark.mllib
e a classe Alternating Least Squares (Mínimos quadrados alternados). - Importe o submódulo de classificação
pyspark.mllib
e a regressão logística com a classe LBFGS. - Importe o submódulo de clustering
pyspark.mllib
e a classe kmeans.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import the library for ALS
from pyspark.mllib.____ import ____
# Import the library for Logistic Regression
from ____.____.____ import ____
# Import the library for Kmeans
from ____.____.____ ____ ____