Algorithmen von PySpark MLlib
Bevor du Algorithmen für maschinelles Lernen in der PySpark-Shell verwendest, musst du die Submodule der Bibliothek pyspark.mllib importieren und dann die entsprechende Klasse auswählen, die für eine bestimmte ML-Aufgabe benötigt wird.
In dieser Übung lernst du, wie du verschiedene Submodule von pyspark.mllib zusammen mit den Klassen importierst, die zur Ausführung von Algorithmen für die kollaborative Filterung, Klassifikation und Clustering nötig sind.
Diese Übung ist Teil des Kurses
<Kurs>Grundlagen von Big Data mit PySpark</Kurs>Übungsanweisungen
- Importiere das „Recommendation“-Submodul von
pyspark.mllibund die „Alternating Least Squares“-Klasse. - Importiere das „Classification“-Submodul von
pyspark.mllibund die „Logistic Regression with LBFGS“-Klasse. - Importiere das „Clustering“-Submodul von
pyspark.mllibund die „KMeans“-Klasse.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import the library for ALS
from pyspark.mllib.____ import ____
# Import the library for Logistic Regression
from ____.____.____ import ____
# Import the library for Kmeans
from ____.____.____ ____ ____