En popüler şarkılar
Spotify verisi üzerinde bir görevin daha var: mevcut tüm yıllar genelinde en popüler 10 şarkıyı bulmak. Kullanman gereken algoritma, her yıl için en popüler 10 şarkıyı hesaplamak, sonra bunları birleştirip “ilk 10’ların ilk 10’unu” bulmak.
Aşağıdaki, bir DataFrame içindeki en popüler 10 şarkıyı bulan fonksiyon sana verildi ve ortamında hazır.
def top_10_most_popular(df):
return df.nlargest(n=10, columns='popularity')
dask ve delayed() fonksiyonu senin için içe aktarıldı. pandas, pd kısaltmasıyla içe aktarıldı. Dosya adlarının listesi ortamında filenames olarak, her dosyanın yılı ise years listesinde bulunuyor.
Bu egzersiz
Python ile Dask ile Paralel Programlama
kursunun bir parçasıdırEgzersiz talimatları
- Her dosya için,
top_10_most_popular()fonksiyonunu kullanarak o yılın en popüler 10 şarkısını bul. - Her yıldan gelen ilk 10’ların listesini hesapla ve ortaya çıkan demetin (tuple) ilk elemanını seç.
- Birleştirilmiş DataFrame üzerinde en popüler 10 şarkıyı bulmak için
top_10_most_popular()fonksiyonunu çalıştır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
top_songs = []
for file in filenames:
df = delayed(pd.read_csv)(file)
# Find the top 10 most popular songs in this file
df_top_10 = ____
top_songs.append(df_top_10)
# Compute the list of top 10s
top_songs_list = ____
# Concatenate them and find the best of the best
top_songs_df = pd.concat(top_songs_list)
df_all_time_top_10 = ____
print(df_all_time_top_10)