Eğitim verilerini tembel (lazy) şekilde dönüştürme
Girdi değişkenlerini önceden işlemek Machine Learning'de kritik bir adımdır ve oluşturduğun modelin doğruluğunu çoğu zaman artırır. Son birkaç egzersizde Spotify verileri senin için önceden işlendi, ancak bunu kendin nasıl yapacağını bilmen önemli.
Bu egzersizde, bir dizinin sütunlarını ortalaması sıfır ve standart sapması bir olacak şekilde dönüştüren StandardScaler() nesnesini kullanacaksın.
Spotify şarkılarından oluşan Dask DataFrame'i çalışma ortamında dask_df olarak mevcut. Bu DataFrame, hem hedef değişken olan popülerlik puanlarını hem de bu puanları tahmin etmek için kullandığın girdi değişkenlerini içeriyor.
Bu egzersiz, kursun bir parçasıdır
Python ile Dask ile Paralel Programlama
Egzersiz talimatları
dask_ml.preprocessingiçindenStandardScaler()sınıfını içe aktar.- DataFrame'den
'popularity'sütununu seç veydeğişkenine ata. - Bir
StandardScalernesnesi oluştur veXverisine fit et. - Ölçekleyiciyi kullanarak
X'i dönüştür.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Import the StandardScaler class
from ____ import ____
X = dask_df[['duration_ms', 'explicit', 'danceability', 'acousticness', 'instrumentalness', 'tempo']]
# Select the target variable
y = ____
# Create a StandardScaler object and fit it on X
scaler = ____
scaler.____(____)
# Transform X
X = scaler.____
print(X)