Algorithmen von PySpark MLlib
Bevor du Algorithmen für maschinelles Lernen in der PySpark-Shell verwendest, musst du die Submodule der Bibliothek pyspark.mllib
importieren und dann die entsprechende Klasse auswählen, die für eine bestimmte ML-Aufgabe benötigt wird.
In dieser Übung lernst du, wie du verschiedene Submodule von pyspark.mllib
zusammen mit den Klassen importierst, die zur Ausführung von Algorithmen für die kollaborative Filterung, Klassifikation und Clustering nötig sind.
Diese Übung ist Teil des Kurses
Grundlagen von Big Data mit PySpark
Anleitung zur Übung
- Importiere das „Recommendation“-Submodul von
pyspark.mllib
und die „Alternating Least Squares“-Klasse. - Importiere das „Classification“-Submodul von
pyspark.mllib
und die „Logistic Regression with LBFGS“-Klasse. - Importiere das „Clustering“-Submodul von
pyspark.mllib
und die „KMeans“-Klasse.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import the library for ALS
from pyspark.mllib.____ import ____
# Import the library for Logistic Regression
from ____.____.____ import ____
# Import the library for Kmeans
from ____.____.____ ____ ____