1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Tvorba doporučovacích systémů s PySparkem

Connected

Cvičení

Sestav pipeline pro křížovou validaci

Teď máme data, rozdělení na trénovací a testovací sadu, model i hodnoty hyperparametrů. Pojďme Sparku říct, jak má model křížově validovat, aby našel nejlepší kombinaci hyperparametrů a vrátil nám ji.

Pokyny

100 XP
  • Vytvoř CrossValidator s názvem cv, kde jako estimátor použij model als. Nastav estimatorParamMaps na param_grid, který jsi právě sestavil/a. Řekni Sparku, že se má jako evaluator použít "evaluator", který jsme sestavili dříve. Nastav numFolds na 5.
  • Ověř, že byl cv správně sestaven, a vypiš ho pomocí print(cv).