1. 학습
  2. /
  3. 강의
  4. /
  5. PySpark로 배우는 빅데이터 기초

Connected

연습 문제

PySpark MLlib 알고리즘

PySpark 셸에서 Machine Learning 알고리즘을 사용하려면, 먼저 pyspark.mllib 라이브러리의 서브모듈을 임포트한 뒤, 해당 작업에 맞는 클래스를 선택해야 해요.

이 간단한 연습 문제에서는 협업 필터링, 분류, 클러스터링 알고리즘을 수행하는 데 필요한 pyspark.mllib의 다양한 서브모듈과 클래스를 어떻게 임포트하는지 배워 봅니다.

지침

100 XP
  • pyspark.mllib의 recommendation 서브모듈과 Alternating Least Squares 클래스를 임포트하세요.
  • pyspark.mllib의 classification 서브모듈과 LBFGS를 사용하는 Logistic Regression 클래스를 임포트하세요.
  • pyspark.mllib의 clustering 서브모듈과 kmeans 클래스를 임포트하세요.