Veriyi ön işle
Çok sınıflı sınıflandırma durumunda veriyi ön işlemenin farklarını öğrendin. Şimdi bunu pratiğe dökelim ve basit bir çok sınıflı sınıflandırma modeli oluşturmadan önce veriyi ön işleyelim.
Veri kümesi news_dataset değişkenine yüklendi ve şu özniteliklere sahip:
news_dataset.data: metinleri içeren dizinews_dataset.target: hedef kategorileri sayısal indeksler olarak içeren dizi
Örnek veri 5.000 gözlem içerir.
Bu egzersiz, kursun bir parçasıdır
Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)
Egzersiz talimatları
Tokenizersınıfınıtokenizerdeğişkeni üzerinde somutlaştır.tokenizerdeğişkenini metin verisi üzerinde fit et.- Metin verisi üzerinde
.texts_to_sequences()metodunu kullan. - Hedef indekslerini hazırlamak için
to_categorical()fonksiyonunu kullan.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create and fit tokenizer
tokenizer = ____
tokenizer.fit_on_texts(____)
# Prepare the data
prep_data = tokenizer.____(news_dataset.data)
prep_data = pad_sequences(prep_data, maxlen=200)
# Prepare the labels
target_labels = to_categorical(____)
# Print the shapes
print(prep_data.shape)
print(target_labels.shape)