1. Обучение
  2. /
  3. Курса
  4. /
  5. Parallel Programming with Dask in Python

Connected

упражнение

Nejpopulárnější písničky

Čeká tě ještě jeden úkol se Spotify daty: najít 10 nejpopulárnějších písniček napříč všemi dostupnými roky. Algoritmus, který k tomu použiješ, funguje tak, že nejprve najdeš top 10 písniček za každý rok, výsledky pak spojíš a z nich vybereš finální top 10.

Následující funkce, která najde 10 nejpopulárnějších písniček v DataFrame, je už připravená a dostupná v tvém prostředí.

def top_10_most_popular(df):
  return df.nlargest(n=10, columns='popularity')

dask a funkce delayed() jsou již naimportované. pandas je naimportovaný jako pd. Seznam názvů souborů je dostupný v proměnné filenames a rok každého souboru je uložen v seznamu years.

Инструкции

100 XP
  • Pro každý soubor najdi 10 nejpopulárnějších písniček za daný rok pomocí funkce top_10_most_popular().
  • Vypočítej seznam top 10 z každého roku a vyber první prvek výsledného tuple.
  • Spusť funkci top_10_most_popular() a najdi 10 nejpopulárnějších písniček napříč spojeným DataFrame.