1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Tvorba doporučovacích systémů s PySparkem

Connected

Cvičení

Vytvoř evaluátor RMSE

Teď, když víš, jak natrénovat model na trénovacích datech a generovat predikce na testovacích datech, potřebuješ způsob, jak vyhodnotit, jak dobře tvůj model funguje. K tomu vytvoříme evaluator. Evaluátory ve Sparku lze sestavit různými způsoby. Pro naše účely chceme regressionEvaluator, který vypočítá RMSE. Jakmile regressionEvaluator vytvoříme, můžeme model natrénovat na datech a generovat predikce.

Pokyny

100 XP
  • Importuj potřebný balíček RegressionEvaluator z třídy pyspark.ml.evaluation.
  • Dokonči kód pro evaluator: zadej metric name jako "rmse", nastav labelCol na název sloupce v datech ratings, který obsahuje hodnocení (název zjistíš metodou ratings.columns), a nastav název sloupce s predikcemi na "prediction".
  • Ověř, že byl evaluator správně vytvořen – extrahuj z něj každý ze tří parametrů. Spusť následující 3 řádky kódu, každý uvnitř příkazu print:
    • evaluator.getMetricName()
    • evaluator.getLabelCol()
    • evaluator.getPredictionCol()