Aan de slagGa gratis aan de slag

PySpark MLlib-algoritmes

Voordat je Machine Learning-algoritmes in de PySpark-shell gaat gebruiken, moet je de submodules van de pyspark.mllib-bibliotheek importeren en vervolgens de juiste klasse kiezen die nodig is voor een specifieke Machine Learning-taak.

In deze korte oefening leer je hoe je de verschillende submodules van pyspark.mllib importeert, samen met de klassen die je nodig hebt voor Collaborative filtering, Classification en Clustering-algoritmes.

Deze oefening maakt deel uit van de cursus

Big Data Fundamentals met PySpark

Cursus bekijken

Oefeninstructies

  • Importeer de pyspark.mllib-submodule recommendation en de Alternating Least Squares-klasse.
  • Importeer de pyspark.mllib-submodule classification en de Logistic Regression with LBFGS-klasse.
  • Importeer de pyspark.mllib-submodule clustering en de kmeans-klasse.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import the library for ALS
from pyspark.mllib.____ import ____

# Import the library for Logistic Regression
from ____.____.____ import ____

# Import the library for Kmeans
from ____.____.____ ____ ____
Code bewerken en uitvoeren