CSV’lerden Dask DataFrame oluşturma
Daha önce, Spotify şarkı verilerini döngüler ve geciktirilmiş (delayed) fonksiyonlar kullanarak analiz etmiştin. Artık aynı işi bir Dask DataFrame kullanarak çok daha kolay yapabileceğini biliyorsun. Hadi, döngüler yerine bu yöntemleri kullanırsan daha önce yaptığın aynı görevlerin ne kadar kolaylaştığına bakalım. Ancak önce, veri kümesini bir Dask DataFrame’e yüklemen gerekecek.
Bu egzersiz, kursun bir parçasıdır
Python ile Dask ile Paralel Programlama
Egzersiz talimatları
dask.dataframealt paketiniddtakma adıyla içe aktar.data/spotifyklasöründeki tüm CSV dosyalarını maksimum 1MBblocksizeile oku.'release_date'sütunundaki string’leridd.to_datetime()fonksiyonuyla datetime’a dönüştür.- DataFrame’in
.head()metodunu kullanarak tablonun 5 satırını göster.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Import dask dataframe as dd
____
# Load in the DataFrame
df = ____
# Convert the release_date column from string to datetime
____
# Show 5 rows of the DataFrame
print(____)