1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Tvorba doporučovacích systémů s PySparkem

Connected

Cvičení

Nejlepší model a jeho parametry

Teď, když máme sestavený cross validator cv, můžeme Sparku říct, aby vzal naše data, přizpůsobil jim algoritmus ALS a vyzkoušel různé kombinace hodnot hyperparametrů z param_grid – tak dokáže určit, které hodnoty vedou k nejmenší RMSE. Tenhle proces by zde trval příliš dlouho, ale pro referenci takhle to funguje:

#Fit cross validator to the 'train' dataset
model = cv.fit(train)

#Extract best model from the cv model above
best_model = model.bestModel

Tento kód byl spuštěn samostatně a best_model byl identifikován a uložen, abys ho mohl/a rovnou použít. Pomocí níže uvedených příkazů extrahuj parametry tohoto modelu.

Pokyny

100 XP
  • Vypiš type(best_model), abys ověřil/a, že model, který ALS sestavil z našich možností hyperparametrů, je skutečně dokončený. Příkaz print je zde nutný, aby správně fungoval spolu s následnými výpisy.
  • Extrahuj hodnotu rank z best_model zavoláním metody .getRank() na best_model.
  • Extrahuj hodnotu maxIter z best_model zavoláním metody .getMaxIter() na best_model.
  • Extrahuj hodnotu regParam z best_model zavoláním metody .getRegParam() na best_model.