Keras ön işleme

Keras’ın en önemli ikinci modülü keras.preprocessing’dir. Ham veriyi doğru giriş şekline hazırlamak için en önemli modül ve fonksiyonları nasıl kullanacağını göreceksin. Keras, daha önce öğrendiğin sözlük yaklaşımının yerini alabilecek işlevler sağlar.

keras.preprocessing.text.Tokenizer modülünü kullanarak .fit_on_texts() yöntemi ile kelimelerden bir sözlük oluşturacak ve .texts_to_sequences() yöntemi ile metinleri, sözlükteki her kelimenin indeksini temsil eden sayısal kimliklere dönüştüreceksin.

Ardından, keras.preprocessing.sequence içindeki .pad_sequences() fonksiyonunu kullanarak tüm dizilerin aynı boyutta olmasını sağlayacaksın (model için gerekli). Bunu, kısa metinlere sıfır ekleyip uzun metinleri keserek yapacağız.

Bu egzersiz, kursun bir parçasıdır

Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

Kursa Göz Atın

Egzersiz talimatları

İlgili modüllerden Tokenizer ve pad_sequences öğelerini içe aktar.
texts içinde saklanan örnek verilere tokenizer nesnesini fit et.
Metinleri .texts_to_sequences() yöntemiyle sayısal indeks dizilerine dönüştür.
Metinlerin boyutunu padding uygulayarak sabitle.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Import relevant classes/functions
from tensorflow.keras.preprocessing.text import ____
from tensorflow.keras.preprocessing.sequence import ____

# Build the dictionary of indexes
tokenizer = Tokenizer()
tokenizer.fit_on_texts(____)

# Change texts into sequence of indexes
texts_numeric = tokenizer.____(texts)
print("Number of words in the sample texts: ({0}, {1})".format(len(texts_numeric[0]), len(texts_numeric[1])))

# Pad the sequences
texts_pad = ____(texts_numeric, 60)
print("Now the texts have fixed length: 60. Let's see the first one: \n{0}".format(texts_pad[0]))

Kodu Düzenle ve Çalıştır

Bu egzersiz, kursun bir parçasıdır

Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

AvançadoNível de habilidade

4.8+

Kursa Ücretsiz Başla

Bu bölümde, Yinelenen Sinir Ağlarının (RNN) temellerini öğreneceksin. Önkoşullarla başlayıp, bilginin ağ içinde nasıl aktığını anlayacak ve son olarak duygu sınıflandırması görevinde bu modelleri Keras ile nasıl uygulayacağını göreceksin.

Exercise 1: Kursa giriş Exercise 2: RNN ve ANN'in parametre sayılarını karşılaştırma Exercise 3: Duygu analizi Exercise 4: Diziden diziye modeller Exercise 5: Dil modellerine giriş Exercise 6: Metin verisine alışma Exercise 7: Model girişi için metin verisini hazırlama Exercise 8: Yeni metni dönüştürme Exercise 9: Keras içinde RNN’e Giriş Exercise 10: Keras modelleri Exercise 11: Keras ön işleme

Geçerli egzersiz

Exercise 12: İlk RNN modelin

RNN’lerde sıkça görülen sönümlenen ve taşan gradyan problemlerini ve bunlarla GRU ile LSTM hücreleri kullanarak nasıl başa çıkılacağını öğreneceksin. Ayrıca, dil modelleri için gömme (embedding) katmanları oluşturacak ve duygu sınıflandırması görevine yeniden göz atacağız.

Exercise 1: Kaybolan ve patlayan gradyanlar Exercise 2: Patlayan gradyan problemi Exercise 3: Kaybolan gradyan sorunu Exercise 4: GRU ve LSTM hücreleri Exercise 5: GRU hücreleri simpleRNN'den daha iyidir Exercise 6: RNN katmanlarını istiflemek Exercise 7: Embedding katmanı Exercise 8: Parametre sayısı karşılaştırması Exercise 9: Transfer öğrenimi Exercise 10: Embedding'ler performansı artırır Exercise 11: Duygu sınıflandırmasına yeniden bakış Exercise 12: Daha iyi duygu sınıflandırması Exercise 13: CNN katmanını kullanma

Sonraki bölümde, çok sınıflı sınıflandırma görevi için veriyi nasıl hazırlayacağını ve çok sınıflı sınıflandırma ile ikili sınıflandırma (duygu analizi) arasındaki farkları öğreneceksin. Son olarak, Keras ile nasıl modeller kuracağını ve performanslarını nasıl ölçeceğini göreceksin.

Exercise 1: Veri ön işleme Exercise 2: Etiket vektörlerini hazırla Exercise 3: Veriyi ön işle Exercise 4: Dil modelleri için transfer öğrenmesi Exercise 5: Transfer learning başlangıç noktası Exercise 6: Word2Vec Exercise 7: Çok sınıflı sınıflandırma modelleri Exercise 8: 20 News Groups veri kümesini keşfetme Exercise 9: Haber makalelerini sınıflandırma Exercise 10: Modelin performansını değerlendirme Exercise 11: Kesinlik-Duyarlılık dengesi Exercise 12: Precision mı Recall mı, işte bütün mesele Exercise 13: Çok sınıflı sınıflandırmada performans

Bu bölümde seni RNN modellerinin iki uygulamasıyla tanıştırıyoruz: Metin Üretimi ve Sinirsel Makine Çevirisi. Metin verisini modellere gerekli formata nasıl hazırlayacağını öğreneceksin. Metin Üretimi modeli, bir karakterin konuşma tarzını çoğaltmak için kullanılır ve Sheldon’ı taklit ederek biraz eğleneceğiz. Sinirsel Makine Çevirisi, örneğin Google Translate tarafından çok daha karmaşık bir modelde kullanılır. Bu bölümde, kısa Portekizce ifadeleri İngilizce’ye çeviren bir model oluşturacaksın.

Exercise 1: Diziden Diziye Modeller Exercise 2: Metin üretimi örnekleri Exercise 3: NMT örneği Exercise 4: Metin Üreten Fonksiyon Exercise 5: Sonraki karakteri tahmin et Exercise 6: Bağlama sahip cümle üret Exercise 7: Olasılık ölçeğini değiştir Exercise 8: Metin Üretim Modelleri Exercise 9: Cümle ve sonraki karakter vektörleri oluştur Exercise 10: Eğitim için veriyi hazırlama Exercise 11: Metin üretim modelini oluşturma Exercise 12: Nöral Makine Çevirisi Exercise 13: Girdi metnini hazırlama Exercise 14: Çıktı metnini hazırlama Exercise 15: Portekizceyi İngilizceye çevir Exercise 16: Tebrikler!