BaşlayınÜcretsiz Başlayın

Doğrusal bir modeli eğitmek için Dask kullanma

Dask, belleğe sığmayacak kadar büyük veri kümeleri üzerinde Machine Learning modelleri eğitmek için kullanılabilir ve veri yükleme, ön işleme ve eğitimi birden çok iş parçacığına, sürece ve hatta birden çok bilgisayara dağıtmana olanak tanır.

Senden, önceki bölümlerde kullandığın Spotify veri kümesindeki şarkıların popülerliğini tahmin edecek bir Machine Learning modeli eğitmen isteniyor. Veriler, tembel (lazy) Dask DataFrame'leri olarak zaten yüklendi. Girdi değişkenleri dask_X içinde ve şarkının tempo ve dans edilebilirlik gibi birkaç sayısal sütunu içeriyor. Hedef değerler dask_y içinde ve her şarkının popülerlik puanını temsil ediyor.

Bu egzersiz

Python ile Dask ile Paralel Programlama

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • sklearn.linear_model içinden SGDRegressor sınıfını ve dask_ml.wrappers içinden Incremental sınıfını içe aktar.
  • Bir SGDRegressor doğrusal regresyon modeli oluştur.
  • Modeli Dask veri kümesiyle eğitilebilir hale getirmek için Incremental sınıfıyla sarmala ve scoring parametresini 'neg_mean_squared_error' olarak ayarla.
  • Sarılmış modeli veriden yalnızca bir kez geçerek eğit.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import the SGDRegressor and the Incremental wrapper
from ____ import ____
from ____ import ____

# Create a SGDRegressor model
model = ____

# Wrap the model so that it works with Dask
dask_model = ____

# Fit the wrapped model
dask_model.____
Kodu Düzenle ve Çalıştır