ComeçarComece gratuitamente

Algoritmos MLlib do PySpark

Antes de usar qualquer algoritmo de aprendizado de máquina no shell do PySpark, você terá que importar os submódulos da biblioteca pyspark.mllib e, em seguida, escolher a classe apropriada necessária para uma tarefa específica de aprendizado de máquina.

Neste exercício simples, você aprenderá a importar os diferentes submódulos do pyspark.mllib juntamente com as classes necessárias para executar os algoritmos de filtragem colaborativa, classificação e clustering.

Este exercício faz parte do curso

Fundamentos de Big Data com PySpark

Ver Curso

Instruções de exercício

  • Importe o submódulo de recomendação pyspark.mllib e a classe Alternating Least Squares (Mínimos quadrados alternados).
  • Importe o submódulo de classificação pyspark.mllib e a regressão logística com a classe LBFGS.
  • Importe o submódulo de clustering pyspark.mllib e a classe kmeans.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Import the library for ALS
from pyspark.mllib.____ import ____

# Import the library for Logistic Regression
from ____.____.____ import ____

# Import the library for Kmeans
from ____.____.____ ____ ____
Editar e executar código