1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nền tảng Big Data với PySpark

Connected

Bài tập

Các thuật toán PySpark MLlib

Trước khi dùng bất kỳ thuật toán Machine Learning nào trong PySpark shell, bạn cần nhập (import) các tiểu mô-đun của thư viện pyspark.mllib, rồi chọn lớp phù hợp cho tác vụ Machine Learning cụ thể.

Trong bài tập đơn giản này, bạn sẽ học cách import các tiểu mô-đun khác nhau của pyspark.mllib cùng các lớp cần dùng để thực hiện các thuật toán Collaborative filtering, Classification và Clustering.

Hướng dẫn

100 XP
  • Import tiểu mô-đun recommendation của pyspark.mllib và lớp Alternating Least Squares.
  • Import tiểu mô-đun classification của pyspark.mllib và lớp Logistic Regression with LBFGS.
  • Import tiểu mô-đun clustering của pyspark.mllib và lớp kmeans.