Veriyi ön işle
Çok sınıflı sınıflandırma durumunda veriyi ön işlemenin farklarını öğrendin. Şimdi bunu pratiğe dökelim ve basit bir çok sınıflı sınıflandırma modeli oluşturmadan önce veriyi ön işleyelim.
Veri kümesi news_dataset değişkenine yüklendi ve şu özniteliklere sahip:
news_dataset.data: metinleri içeren dizinews_dataset.target: hedef kategorileri sayısal indeksler olarak içeren dizi
Örnek veri 5.000 gözlem içerir.
Bu egzersiz
Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)
kursunun bir parçasıdırEgzersiz talimatları
Tokenizersınıfınıtokenizerdeğişkeni üzerinde somutlaştır.tokenizerdeğişkenini metin verisi üzerinde fit et.- Metin verisi üzerinde
.texts_to_sequences()metodunu kullan. - Hedef indekslerini hazırlamak için
to_categorical()fonksiyonunu kullan.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create and fit tokenizer
tokenizer = ____
tokenizer.fit_on_texts(____)
# Prepare the data
prep_data = tokenizer.____(news_dataset.data)
prep_data = pad_sequences(prep_data, maxlen=200)
# Prepare the labels
target_labels = to_categorical(____)
# Print the shapes
print(prep_data.shape)
print(target_labels.shape)