1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Tvorba doporučovacích systémů s PySparkem

Connected

Cvičení

Vytvoř trénovací a testovací sady a sestav model ALS

Jak sestavit model ALS už víš – dělal/a jsi to v předchozí kapitole. Uděláme to znovu, ale tentokrát přidáme několik kroků, abychom model plně připravili pro křížovou validaci.

Nejdřív naimportujeme potřebné funkce a vytvoříme trénovací a testovací datové sady pro krok křížové validace.

Pokyny

100 XP
  • Naimportuj RegressionEvaluator z ml.evaluation, algoritmus ALS z ml.recommendation a třídy ParamGridBuilder a CrossValidator z ml.tuning.
  • Rozděl data ratings na trénovací a testovací sadu v poměru 80/20 pomocí metody randomSplit. Datové sady pojmenuj train a test a nastav náhodný seed na 1234.
  • Sestav model ALS – řekni Sparku, které sloupce dataframu ratings odpovídají userCol, itemCol a ratingCol. Argument nonnegative nastav na True, coldStartStrategy na "drop" a implicitPrefs na False, aby Spark věděl, že nepracujeme s implicitními preferencemi. Model pojmenuj als.
  • Ověř, že byl model vytvořen – zavolej funkci type() na proměnné als. Výstup by měl ukázat, o jaký typ modelu se jedná.