BaşlayınÜcretsiz başlayın

CSV’lerden Dask DataFrame oluşturma

Daha önce, Spotify şarkı verilerini döngüler ve geciktirilmiş (delayed) fonksiyonlar kullanarak analiz etmiştin. Artık aynı işi bir Dask DataFrame kullanarak çok daha kolay yapabileceğini biliyorsun. Hadi, döngüler yerine bu yöntemleri kullanırsan daha önce yaptığın aynı görevlerin ne kadar kolaylaştığına bakalım. Ancak önce, veri kümesini bir Dask DataFrame’e yüklemen gerekecek.

Bu egzersiz, kursun bir parçasıdır

Python ile Dask ile Paralel Programlama

Kursa Göz Atın

Egzersiz talimatları

  • dask.dataframe alt paketini dd takma adıyla içe aktar.
  • data/spotify klasöründeki tüm CSV dosyalarını maksimum 1MB blocksize ile oku.
  • 'release_date' sütunundaki string’leri dd.to_datetime() fonksiyonuyla datetime’a dönüştür.
  • DataFrame’in .head() metodunu kullanarak tablonun 5 satırını göster.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Import dask dataframe as dd
____

# Load in the DataFrame
df  = ____

# Convert the release_date column from string to datetime
____

# Show 5 rows of the DataFrame
print(____)
Kodu Düzenle ve Çalıştır