1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do inżynierii danych

Connected

ćwiczenie

Łączenie z ocenami

W ćwiczeniu wideo zobaczyłeś(-aś), jak stosować transformacje w PySparku, łącząc tabele film i ratings w celu utworzenia nowej kolumny przechowującej średnią ocenę na klienta. W tym ćwiczeniu pogłębisz integrację tabel film i ratings – korzystając z tych samych technik, obliczysz średnią ocenę dla każdego filmu.

DataFrame PySpark z filmami, film_df, oraz DataFrame PySpark z ocenami, rating_df, są dostępne w twoim środowisku pracy.

Instrukcje

100 XP
  • Oblicz średnią ocenę dla każdego film_id i przypisz wynik do ratings_per_film_df.
  • Uzupełnij instrukcję .join(), aby złączyć tabele po kolumnie film_id.
  • Wyświetl pierwsze 5 wyników otrzymanego DataFrame.