MulaiMulai sekarang secara gratis

Lagu paling populer

Anda memiliki satu tugas lagi pada data Spotify ini, yaitu mencari 10 lagu paling populer di semua tahun yang tersedia. Algoritme yang perlu Anda gunakan adalah menghitung 10 lagu teratas di setiap tahun, lalu menggabungkannya dan mencari 10 teratas dari kumpulan 10 teratas tersebut.

Fungsi berikut, yang menemukan 10 lagu teratas dalam sebuah DataFrame, telah disediakan untuk Anda dan tersedia di lingkungan Anda.

def top_10_most_popular(df):
  return df.nlargest(n=10, columns='popularity')

dask dan fungsi delayed() telah diimpor untuk Anda. pandas telah diimpor sebagai pd. Daftar nama file tersedia di lingkungan Anda sebagai filenames, dan tahun dari setiap file disimpan dalam list years.

Latihan ini adalah bagian dari kursus

Pemrograman Paralel dengan Dask di Python

Lihat Kursus

Petunjuk latihan

  • Untuk setiap file, cari 10 lagu teratas pada tahun tersebut menggunakan fungsi top_10_most_popular().
  • Hitung list berisi kumpulan 10 teratas dari tiap tahun, lalu pilih item pertama dari tuple hasilnya.
  • Jalankan fungsi top_10_most_popular() untuk mencari 10 lagu teratas pada DataFrame hasil penggabungan.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

top_songs = []

for file in filenames:
    df = delayed(pd.read_csv)(file)
    # Find the top 10 most popular songs in this file
    df_top_10 = ____
    top_songs.append(df_top_10)

# Compute the list of top 10s
top_songs_list = ____

# Concatenate them and find the best of the best
top_songs_df = pd.concat(top_songs_list)
df_all_time_top_10 = ____
print(df_all_time_top_10)
Edit dan Jalankan Kode