PySpark MLlib-algoritmes
Voordat je Machine Learning-algoritmes in de PySpark-shell gaat gebruiken, moet je de submodules van de pyspark.mllib-bibliotheek importeren en vervolgens de juiste klasse kiezen die nodig is voor een specifieke Machine Learning-taak.
In deze korte oefening leer je hoe je de verschillende submodules van pyspark.mllib importeert, samen met de klassen die je nodig hebt voor Collaborative filtering, Classification en Clustering-algoritmes.
Deze oefening maakt deel uit van de cursus
Big Data Fundamentals met PySpark
Oefeninstructies
- Importeer de
pyspark.mllib-submodule recommendation en de Alternating Least Squares-klasse. - Importeer de
pyspark.mllib-submodule classification en de Logistic Regression with LBFGS-klasse. - Importeer de
pyspark.mllib-submodule clustering en de kmeans-klasse.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the library for ALS
from pyspark.mllib.____ import ____
# Import the library for Logistic Regression
from ____.____.____ import ____
# Import the library for Kmeans
from ____.____.____ ____ ____