BaşlayınÜcretsiz Başlayın

Eğitim verilerini tembel (lazy) şekilde dönüştürme

Girdi değişkenlerini önceden işlemek Machine Learning'de kritik bir adımdır ve oluşturduğun modelin doğruluğunu çoğu zaman artırır. Son birkaç egzersizde Spotify verileri senin için önceden işlendi, ancak bunu kendin nasıl yapacağını bilmen önemli.

Bu egzersizde, bir dizinin sütunlarını ortalaması sıfır ve standart sapması bir olacak şekilde dönüştüren StandardScaler() nesnesini kullanacaksın.

Spotify şarkılarından oluşan Dask DataFrame'i çalışma ortamında dask_df olarak mevcut. Bu DataFrame, hem hedef değişken olan popülerlik puanlarını hem de bu puanları tahmin etmek için kullandığın girdi değişkenlerini içeriyor.

Bu egzersiz

Python ile Dask ile Paralel Programlama

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • dask_ml.preprocessing içinden StandardScaler() sınıfını içe aktar.
  • DataFrame'den 'popularity' sütununu seç ve y değişkenine ata.
  • Bir StandardScaler nesnesi oluştur ve X verisine fit et.
  • Ölçekleyiciyi kullanarak X'i dönüştür.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import the StandardScaler class
from ____ import ____

X = dask_df[['duration_ms', 'explicit', 'danceability', 'acousticness', 'instrumentalness', 'tempo']]

# Select the target variable
y = ____

# Create a StandardScaler object and fit it on X
scaler = ____
scaler.____(____)

# Transform X
X = scaler.____
print(X)
Kodu Düzenle ve Çalıştır