Algorithmes PySpark MLlib
Avant d'utiliser des algorithmes de machine learning dans le shell PySpark, vous devrez importer les sous-modules de la bibliothèque pyspark.mllib
, puis choisir la classe appropriée nécessaire à une tâche de machine learning spécifique.
Dans cet exercice simple, vous apprendrez à importer les différents sous-modules de pyspark.mllib
ainsi que les classes nécessaires à l'exécution des algorithmes de filtrage collaboratif, de classification et de clustering.
Cet exercice fait partie du cours
Principes fondamentaux des mégadonnées avec PySpark
Instructions
- Importez le sous-module de recommandation
pyspark.mllib
et la classe Alternating Least Squares. - Importez le sous-module de classification
pyspark.mllib
et la régression logistique avec la classe LBFGS. - Importez le sous-module de clustering
pyspark.mllib
et la classe kmeans.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the library for ALS
from pyspark.mllib.____ import ____
# Import the library for Logistic Regression
from ____.____.____ import ____
# Import the library for Kmeans
from ____.____.____ ____ ____