BaşlayınÜcretsiz başlayın

Veriyi ön işle

Çok sınıflı sınıflandırma durumunda veriyi ön işlemenin farklarını öğrendin. Şimdi bunu pratiğe dökelim ve basit bir çok sınıflı sınıflandırma modeli oluşturmadan önce veriyi ön işleyelim.

Veri kümesi news_dataset değişkenine yüklendi ve şu özniteliklere sahip:

  • news_dataset.data: metinleri içeren dizi
  • news_dataset.target: hedef kategorileri sayısal indeksler olarak içeren dizi

Örnek veri 5.000 gözlem içerir.

Bu egzersiz, kursun bir parçasıdır

Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

Kursa Göz Atın

Egzersiz talimatları

  • Tokenizer sınıfını tokenizer değişkeni üzerinde somutlaştır.
  • tokenizer değişkenini metin verisi üzerinde fit et.
  • Metin verisi üzerinde .texts_to_sequences() metodunu kullan.
  • Hedef indekslerini hazırlamak için to_categorical() fonksiyonunu kullan.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Create and fit tokenizer
tokenizer = ____
tokenizer.fit_on_texts(____)

# Prepare the data
prep_data = tokenizer.____(news_dataset.data)
prep_data = pad_sequences(prep_data, maxlen=200)

# Prepare the labels
target_labels = to_categorical(____)

# Print the shapes
print(prep_data.shape)
print(target_labels.shape)
Kodu Düzenle ve Çalıştır