BaşlayınÜcretsiz Başlayın

Veriyi ön işle

Çok sınıflı sınıflandırma durumunda veriyi ön işlemenin farklarını öğrendin. Şimdi bunu pratiğe dökelim ve basit bir çok sınıflı sınıflandırma modeli oluşturmadan önce veriyi ön işleyelim.

Veri kümesi news_dataset değişkenine yüklendi ve şu özniteliklere sahip:

  • news_dataset.data: metinleri içeren dizi
  • news_dataset.target: hedef kategorileri sayısal indeksler olarak içeren dizi

Örnek veri 5.000 gözlem içerir.

Bu egzersiz

Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Tokenizer sınıfını tokenizer değişkeni üzerinde somutlaştır.
  • tokenizer değişkenini metin verisi üzerinde fit et.
  • Metin verisi üzerinde .texts_to_sequences() metodunu kullan.
  • Hedef indekslerini hazırlamak için to_categorical() fonksiyonunu kullan.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create and fit tokenizer
tokenizer = ____
tokenizer.fit_on_texts(____)

# Prepare the data
prep_data = tokenizer.____(news_dataset.data)
prep_data = pad_sequences(prep_data, maxlen=200)

# Prepare the labels
target_labels = to_categorical(____)

# Print the shapes
print(prep_data.shape)
print(target_labels.shape)
Kodu Düzenle ve Çalıştır