BaşlayınÜcretsiz başlayın

En popüler şarkılar

Spotify verisi üzerinde bir görevin daha var: mevcut tüm yıllar genelinde en popüler 10 şarkıyı bulmak. Kullanman gereken algoritma, her yıl için en popüler 10 şarkıyı hesaplamak, sonra bunları birleştirip “ilk 10’ların ilk 10’unu” bulmak.

Aşağıdaki, bir DataFrame içindeki en popüler 10 şarkıyı bulan fonksiyon sana verildi ve ortamında hazır.

def top_10_most_popular(df):
  return df.nlargest(n=10, columns='popularity')

dask ve delayed() fonksiyonu senin için içe aktarıldı. pandas, pd kısaltmasıyla içe aktarıldı. Dosya adlarının listesi ortamında filenames olarak, her dosyanın yılı ise years listesinde bulunuyor.

Bu egzersiz, kursun bir parçasıdır

Python ile Dask ile Paralel Programlama

Kursa Göz Atın

Egzersiz talimatları

  • Her dosya için, top_10_most_popular() fonksiyonunu kullanarak o yılın en popüler 10 şarkısını bul.
  • Her yıldan gelen ilk 10’ların listesini hesapla ve ortaya çıkan demetin (tuple) ilk elemanını seç.
  • Birleştirilmiş DataFrame üzerinde en popüler 10 şarkıyı bulmak için top_10_most_popular() fonksiyonunu çalıştır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

top_songs = []

for file in filenames:
    df = delayed(pd.read_csv)(file)
    # Find the top 10 most popular songs in this file
    df_top_10 = ____
    top_songs.append(df_top_10)

# Compute the list of top 10s
top_songs_list = ____

# Concatenate them and find the best of the best
top_songs_df = pd.concat(top_songs_list)
df_all_time_top_10 = ____
print(df_all_time_top_10)
Kodu Düzenle ve Çalıştır