BaşlayınÜcretsiz Başlayın

CSV’lerden Dask DataFrame oluşturma

Daha önce, Spotify şarkı verilerini döngüler ve geciktirilmiş (delayed) fonksiyonlar kullanarak analiz etmiştin. Artık aynı işi bir Dask DataFrame kullanarak çok daha kolay yapabileceğini biliyorsun. Hadi, döngüler yerine bu yöntemleri kullanırsan daha önce yaptığın aynı görevlerin ne kadar kolaylaştığına bakalım. Ancak önce, veri kümesini bir Dask DataFrame’e yüklemen gerekecek.

Bu egzersiz

Python ile Dask ile Paralel Programlama

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • dask.dataframe alt paketini dd takma adıyla içe aktar.
  • data/spotify klasöründeki tüm CSV dosyalarını maksimum 1MB blocksize ile oku.
  • 'release_date' sütunundaki string’leri dd.to_datetime() fonksiyonuyla datetime’a dönüştür.
  • DataFrame’in .head() metodunu kullanarak tablonun 5 satırını göster.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import dask dataframe as dd
____

# Load in the DataFrame
df  = ____

# Convert the release_date column from string to datetime
____

# Show 5 rows of the DataFrame
print(____)
Kodu Düzenle ve Çalıştır