1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Budowanie silników rekomendacji w PySpark

Connected

cvičení

Najlepszy model i jego parametry

Teraz, gdy mamy gotowy walidator krzyżowy cv, możemy zlecić Sparkowi dopasowanie algorytmu ALS do danych i przetestowanie różnych kombinacji wartości hiperparametrów z param_grid — w celu znalezienia tych, które dają najmniejszy błąd RMSE. Niestety, ten proces trwa zbyt długo, aby uruchamiać go tutaj, ale dla celów referencyjnych poniżej znajdziesz sposób, w jaki się to robi:

#Fit cross validator to the 'train' dataset
model = cv.fit(train)

#Extract best model from the cv model above
best_model = model.bestModel

Ten kod został uruchomiony osobno, a best_model został zidentyfikowany i zapisany do twojego użytku. Skorzystaj z podanych poleceń, aby wyodrębnić parametry modelu.

Pokyny

100 XP
  • Wyświetl type(best_model), aby potwierdzić, że model ALS zbudowany na podstawie podanych opcji hiperparametrów jest kompletny. Instrukcja print jest tutaj konieczna, aby kolejne wywołania print działały poprawnie.
  • Wyodrębnij wartość rank z best_model, wywołując metodę .getRank() na best_model.
  • Wyodrębnij wartość maxIter z best_model, wywołując metodę .getMaxIter() na best_model.
  • Wyodrębnij wartość regParam z best_model, wywołując metodę .getRegParam() na best_model.