Eğitim verilerini tembel (lazy) şekilde dönüştürme

Girdi değişkenlerini önceden işlemek Machine Learning'de kritik bir adımdır ve oluşturduğun modelin doğruluğunu çoğu zaman artırır. Son birkaç egzersizde Spotify verileri senin için önceden işlendi, ancak bunu kendin nasıl yapacağını bilmen önemli.

Bu egzersizde, bir dizinin sütunlarını ortalaması sıfır ve standart sapması bir olacak şekilde dönüştüren StandardScaler() nesnesini kullanacaksın.

Spotify şarkılarından oluşan Dask DataFrame'i çalışma ortamında dask_df olarak mevcut. Bu DataFrame, hem hedef değişken olan popülerlik puanlarını hem de bu puanları tahmin etmek için kullandığın girdi değişkenlerini içeriyor.

Bu egzersiz, kursun bir parçasıdır

Python ile Dask ile Paralel Programlama

Kursa Göz Atın

Egzersiz talimatları

dask_ml.preprocessing içinden StandardScaler() sınıfını içe aktar.
DataFrame'den 'popularity' sütununu seç ve y değişkenine ata.
Bir StandardScaler nesnesi oluştur ve X verisine fit et.
Ölçekleyiciyi kullanarak X'i dönüştür.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Import the StandardScaler class
from ____ import ____

X = dask_df[['duration_ms', 'explicit', 'danceability', 'acousticness', 'instrumentalness', 'tempo']]

# Select the target variable
y = ____

# Create a StandardScaler object and fit it on X
scaler = ____
scaler.____(____)

# Transform X
X = scaler.____
print(X)

Kodu Düzenle ve Çalıştır