1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Tvorba doporučovacích systémů s PySparkem

Connected

Cvičení

Řekni Sparku, jak ladit tvůj ALS model

Teď vytvoříme ParamGrid, který Sparku řekne, jaké hyperparametry má ladit a jak to dělat. Pak sestavíme evaluátor, aby Spark věděl, jak měřit výkon algoritmu.

Pokyny

100 XP
  • Importuj RegressionEvaluator z pyspark.ml.evaluation a ParamGridBuilder a CrossValidator z pyspark.ml.tuning.
  • Pomocí ParamGridBuilder sestav ParamGrid s názvem param_grid. Na každý hyperparametr zavolej metodu .addGrid() – zadej název modelu a název daného hyperparametru (např. .addGrid(als.rank, [])). Udělej to pro hyperparametry rank, maxIter a regParam. Jako hodnoty, které má Spark vyzkoušet, použij tyto seznamy:
 rank: [10, 50, 100, 150]  
 maxIter: [5, 50, 100, 200]  
 regParam: [.01, .05, .1, .15]  
  • Vytvoř RegressionEvaluator s názvem evaluator. Nastav metricName na "rmse", labelCol na "rating" a Sparku řekni, že sloupec s predikcemi má pojmenovat predictionCol jako "prediction".
  • Spusť len(param_grid), abys ověřil/a, že byl param_grid správně vytvořen a že bude otestován správný počet kombinací hyperparametrů. Výsledek by se měl rovnat počtu hodnot rank * počtu hodnot maxIter * počtu hodnot regParam v ParamGridBuilder.