Eğitim verilerini tembel (lazy) şekilde dönüştürme
Girdi değişkenlerini önceden işlemek Machine Learning'de kritik bir adımdır ve oluşturduğun modelin doğruluğunu çoğu zaman artırır. Son birkaç egzersizde Spotify verileri senin için önceden işlendi, ancak bunu kendin nasıl yapacağını bilmen önemli.
Bu egzersizde, bir dizinin sütunlarını ortalaması sıfır ve standart sapması bir olacak şekilde dönüştüren StandardScaler() nesnesini kullanacaksın.
Spotify şarkılarından oluşan Dask DataFrame'i çalışma ortamında dask_df olarak mevcut. Bu DataFrame, hem hedef değişken olan popülerlik puanlarını hem de bu puanları tahmin etmek için kullandığın girdi değişkenlerini içeriyor.
Bu egzersiz
Python ile Dask ile Paralel Programlama
kursunun bir parçasıdırEgzersiz talimatları
dask_ml.preprocessingiçindenStandardScaler()sınıfını içe aktar.- DataFrame'den
'popularity'sütununu seç veydeğişkenine ata. - Bir
StandardScalernesnesi oluştur veXverisine fit et. - Ölçekleyiciyi kullanarak
X'i dönüştür.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import the StandardScaler class
from ____ import ____
X = dask_df[['duration_ms', 'explicit', 'danceability', 'acousticness', 'instrumentalness', 'tempo']]
# Select the target variable
y = ____
# Create a StandardScaler object and fit it on X
scaler = ____
scaler.____(____)
# Transform X
X = scaler.____
print(X)