Doğrusal bir modeli eğitmek için Dask kullanma
Dask, belleğe sığmayacak kadar büyük veri kümeleri üzerinde Machine Learning modelleri eğitmek için kullanılabilir ve veri yükleme, ön işleme ve eğitimi birden çok iş parçacığına, sürece ve hatta birden çok bilgisayara dağıtmana olanak tanır.
Senden, önceki bölümlerde kullandığın Spotify veri kümesindeki şarkıların popülerliğini tahmin edecek bir Machine Learning modeli eğitmen isteniyor. Veriler, tembel (lazy) Dask DataFrame'leri olarak zaten yüklendi. Girdi değişkenleri dask_X içinde ve şarkının tempo ve dans edilebilirlik gibi birkaç sayısal sütunu içeriyor. Hedef değerler dask_y içinde ve her şarkının popülerlik puanını temsil ediyor.
Bu egzersiz
Python ile Dask ile Paralel Programlama
kursunun bir parçasıdırEgzersiz talimatları
sklearn.linear_modeliçindenSGDRegressorsınıfını vedask_ml.wrappersiçindenIncrementalsınıfını içe aktar.- Bir
SGDRegressordoğrusal regresyon modeli oluştur. - Modeli Dask veri kümesiyle eğitilebilir hale getirmek için
Incrementalsınıfıyla sarmala vescoringparametresini'neg_mean_squared_error'olarak ayarla. - Sarılmış modeli veriden yalnızca bir kez geçerek eğit.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import the SGDRegressor and the Incremental wrapper
from ____ import ____
from ____ import ____
# Create a SGDRegressor model
model = ____
# Wrap the model so that it works with Dask
dask_model = ____
# Fit the wrapped model
dask_model.____