1. Nauka
  2. /
  3. Kursy
  4. /
  5. Budowanie silników rekomendacji w PySpark

Connected

ćwiczenie

Wydajność modelu binarnego

Budowanie modeli ALS masz już za sobą, więc tym razem tego pomijamy. Model ALS oparty na danych niejawnych został już dopasowany do binarnych ocen ze zbioru danych MovieLens. Przyjrzyjmy się binary_test_predictions z tego modelu i zobaczmy, co możemy z nich wyczytać.

Funkcja ROEM() jest już dla ciebie zdefiniowana. Jeśli chcesz dowiedzieć się więcej o jej działaniu, uruchom help(ROEM) w konsoli!

Instrukcje

100 XP
  • Zaimportuj funkcję col z klasy pyspark.sql.functions.
  • Przyjrzyj się binary_test_predictions za pomocą metody .show(), aby zrozumieć strukturę danych.
  • Wywołaj ROEM() na binary_test_predictions, aby ocenić wydajność modelu. Czy uważasz, że model poradził sobie dobrze?
  • Użyj .filter(), aby wyświetlić tylko predykcje dla użytkownika 42 (col("userId") == 42). Czy zauważasz coś ciekawego?