1. Nauka
  2. /
  3. Kursy
  4. /
  5. Budowanie silników rekomendacji w PySpark

Connected

ćwiczenie

Budowanie ewaluatora RMSE

Wiesz już, jak dopasować model do danych treningowych i generować prognozy na zbiorze testowym. Teraz potrzebujesz sposobu na ocenę jakości modelu. W tym celu zbudujesz evaluator. Ewaluatory w Sparku można tworzyć na różne sposoby. Na nasze potrzeby przyda się regressionEvaluator, który oblicza RMSE. Po jego zbudowaniu możesz dopasować model do danych i wygenerować prognozy.

Instrukcje

100 XP
  • Zaimportuj wymagany pakiet RegressionEvaluator z klasy pyspark.ml.evaluation.
  • Uzupełnij kod evaluator, podając metric name jako "rmse". Ustaw labelCol na nazwę kolumny w zbiorze danych ratings, która zawiera oceny (użyj metody ratings.columns, aby sprawdzić nazwy kolumn), a prediction column name ustaw na "prediction".
  • Sprawdź, czy evaluator został poprawnie utworzony, wyodrębniając każdy z trzech parametrów. W tym celu uruchom poniższe 3 linie kodu, każdą w instrukcji print:
    • evaluator.getMetricName()
    • evaluator.getLabelCol()
    • evaluator.getPredictionCol()