1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Tvorba doporučovacích systémů s PySparkem

Connected

Cvičení

Typy dat hodnocení

Markus sleduje spoustu filmů – dokumenty, filmy o superhrdinech, klasiky i dramata. Využij své dosavadní zkušenosti se Sparkem a pracuj s dataframem markus_ratings, který obsahuje údaje o tom, kolikrát Markus viděl filmy v různých žánrech. Zamysli se nad tím, zda jde o implicitní, nebo explicitní hodnocení. Pomocí metody groupBy() zjisti, který žánr má nejvyšší hodnocení – to může zásadně ovlivnit, jaká doporučení ALS pro Markuse vygeneruje.

Pokyny

100 XP
  • Pomocí metody groupBy() seskup dataframe markus_ratings podle sloupce "Genre".
  • Použij metodu .sum() pro získání celkového počtu zhlédnutých filmů v každém žánru.
  • Nezapomeň na konec přidat metodu .show(), aby se výsledky zobrazily.