1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Tvorba doporučovacích systémů s PySparkem

Connected

Cvičení

Generování predikcí a výpočet RMSE

Teď, když máme model natrénovaný na našich datech a doladěný pomocí křížové validace, můžeme zjistit, jak si povede na dataframu test. K tomu využijeme výpočet RMSE.

Poznámka na okraj: generování testovacích predikcí na tomto datasetu trvá několik minut. Testovací predikce proto byly vygenerovány předem a jsou ti k dispozici jako dataframe test_predictions. Pro přehled – byly vygenerovány tímto kódem: test_predictions = best_model.transform(test).

Pokyny

100 XP
  • Dataframe test_predictions obsahuje predikce, které náš křížově validovaný ALS model vygeneroval pomocí sady test vytvořené dříve. Pomocí metody .show() se na něj podívej a zjisti, zda jsou predikce přibližně přesné.
  • Pomocí evaluator, který jsi sestavil/a dříve, vypočítej RMSE tak, že zavoláš metodu .evaluate() na vygenerovaných test_predictions. Výsledek ulož jako RMSE.
  • Vypiš hodnotu RMSE.