PySpark MLlib-algoritmes

Voordat je Machine Learning-algoritmes in de PySpark-shell gaat gebruiken, moet je de submodules van de pyspark.mllib-bibliotheek importeren en vervolgens de juiste klasse kiezen die nodig is voor een specifieke Machine Learning-taak.

In deze korte oefening leer je hoe je de verschillende submodules van pyspark.mllib importeert, samen met de klassen die je nodig hebt voor Collaborative filtering, Classification en Clustering-algoritmes.

Deze oefening maakt deel uit van de cursus

Big Data Fundamentals met PySpark

Bekijk cursus

Oefeninstructies

Importeer de pyspark.mllib-submodule recommendation en de Alternating Least Squares-klasse.
Importeer de pyspark.mllib-submodule classification en de Logistic Regression with LBFGS-klasse.
Importeer de pyspark.mllib-submodule clustering en de kmeans-klasse.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Import the library for ALS
from pyspark.mllib.____ import ____

# Import the library for Logistic Regression
from ____.____.____ import ____

# Import the library for Kmeans
from ____.____.____ ____ ____

Code bewerken en uitvoeren