1. Nauka
  2. /
  3. Kursy
  4. /
  5. Budowanie silników rekomendacji w PySpark

Connected

ćwiczenie

Generowanie predykcji i obliczanie RMSE

Mamy już model wytrenowany na naszych danych i dostrojony za pomocą walidacji krzyżowej – czas sprawdzić, jak radzi sobie na ramce danych test. W tym celu obliczymy RMSE.

Warto wiedzieć, że generowanie predykcji testowych na tym zbiorze danych zajmuje kilka minut. Dlatego zostały one już wygenerowane i są dostępne jako ramka danych test_predictions. Dla przypomnienia – do ich wygenerowania użyto następującego kodu: test_predictions = best_model.transform(test).

Instrukcje

100 XP
  • Ramka danych test_predictions zawiera predykcje wygenerowane przez nasz model ALS z walidacją krzyżową na podstawie zbioru test, który utworzyliśmy wcześniej. Użyj metody .show(), aby przyjrzeć się jej zawartości i sprawdzić, czy predykcje wyglądają wiarygodnie.
  • Użyj evaluator, który zbudowałeś wcześniej, aby obliczyć RMSE – wywołaj metodę .evaluate() na ramce test_predictions. Zapisz wynik jako RMSE.
  • Wyświetl wartość RMSE.