Model girişi için metin verisini hazırlama

Daha önce, kelimelerden indekslere ve tam tersine sözlükler oluşturmayı öğrendin. Bu egzersizde, metni karakterlere göre bölecek ve veriyi denetimli öğrenme için hazırlamaya devam edeceksin.

Metinleri karakterlere bölmek garip gelebilir, ama metin üretimi için sıkça yapılır. Ayrıca, veriyi hazırlama süreci aynıdır; tek fark metnin nasıl bölündüğüdür.

Sabit uzunlukta metinler ve etiketlerinden (karşılık gelen bir sonraki karakterler) oluşan eğitim verisini oluşturacaksın.

Sheldon (The Big Bang Theory) alıntılarını içeren ve sheldon_quotes değişkeninde bulunan veri kümesini kullanmaya devam edeceksin.

print_examples() fonksiyonu, verinin nasıl dönüştürüldüğünü görebilmen için çiftleri yazdırır. Ayrıntılar için help() kullan.

Bu egzersiz, kursun bir parçasıdır

Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

Kursa Göz Atın

Egzersiz talimatları

step değerini 2, chars_window değerini 10 olarak tanımla.
Bir sonraki cümleyi sentences değişkenine ekle.
Metin sheldon içinde doğru konumu next_chars değişkenine ekle.
print_examples() fonksiyonunu kullanarak 10 cümleyi ve bir sonraki karakterleri yazdır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Create lists to keep the sentences and the next character
sentences = []   # ~ Training data
next_chars = []  # ~ Training labels

# Define hyperparameters
step = ____          # ~ Step to take when reading the texts in characters
chars_window = ____ # ~ Number of characters to use to predict the next one  

# Loop over the text: length `chars_window` per time with step equal to `step`
for i in range(0, len(sheldon_quotes) - chars_window, step):
    sentences.____(sheldon_quotes[i:i + chars_window])
    next_chars.append(sheldon_quotes[____])

# Print 10 pairs
print_examples(____, ____, 10)

Kodu Düzenle ve Çalıştır

Bu egzersiz, kursun bir parçasıdır

Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

AvançadoNível de habilidade

4.8+

Kursa Ücretsiz Başla

Bu bölümde, Yinelenen Sinir Ağlarının (RNN) temellerini öğreneceksin. Önkoşullarla başlayıp, bilginin ağ içinde nasıl aktığını anlayacak ve son olarak duygu sınıflandırması görevinde bu modelleri Keras ile nasıl uygulayacağını göreceksin.

Exercise 1: Kursa giriş Exercise 2: RNN ve ANN'in parametre sayılarını karşılaştırma Exercise 3: Duygu analizi Exercise 4: Diziden diziye modeller Exercise 5: Dil modellerine giriş Exercise 6: Metin verisine alışma Exercise 7: Model girişi için metin verisini hazırlama

Geçerli egzersiz

Exercise 8: Yeni metni dönüştürme Exercise 9: Keras içinde RNN’e Giriş Exercise 10: Keras modelleri Exercise 11: Keras ön işleme Exercise 12: İlk RNN modelin

RNN’lerde sıkça görülen sönümlenen ve taşan gradyan problemlerini ve bunlarla GRU ile LSTM hücreleri kullanarak nasıl başa çıkılacağını öğreneceksin. Ayrıca, dil modelleri için gömme (embedding) katmanları oluşturacak ve duygu sınıflandırması görevine yeniden göz atacağız.

Exercise 1: Kaybolan ve patlayan gradyanlar Exercise 2: Patlayan gradyan problemi Exercise 3: Kaybolan gradyan sorunu Exercise 4: GRU ve LSTM hücreleri Exercise 5: GRU hücreleri simpleRNN'den daha iyidir Exercise 6: RNN katmanlarını istiflemek Exercise 7: Embedding katmanı Exercise 8: Parametre sayısı karşılaştırması Exercise 9: Transfer öğrenimi Exercise 10: Embedding'ler performansı artırır Exercise 11: Duygu sınıflandırmasına yeniden bakış Exercise 12: Daha iyi duygu sınıflandırması Exercise 13: CNN katmanını kullanma

Sonraki bölümde, çok sınıflı sınıflandırma görevi için veriyi nasıl hazırlayacağını ve çok sınıflı sınıflandırma ile ikili sınıflandırma (duygu analizi) arasındaki farkları öğreneceksin. Son olarak, Keras ile nasıl modeller kuracağını ve performanslarını nasıl ölçeceğini göreceksin.

Exercise 1: Veri ön işleme Exercise 2: Etiket vektörlerini hazırla Exercise 3: Veriyi ön işle Exercise 4: Dil modelleri için transfer öğrenmesi Exercise 5: Transfer learning başlangıç noktası Exercise 6: Word2Vec Exercise 7: Çok sınıflı sınıflandırma modelleri Exercise 8: 20 News Groups veri kümesini keşfetme Exercise 9: Haber makalelerini sınıflandırma Exercise 10: Modelin performansını değerlendirme Exercise 11: Kesinlik-Duyarlılık dengesi Exercise 12: Precision mı Recall mı, işte bütün mesele Exercise 13: Çok sınıflı sınıflandırmada performans

Bu bölümde seni RNN modellerinin iki uygulamasıyla tanıştırıyoruz: Metin Üretimi ve Sinirsel Makine Çevirisi. Metin verisini modellere gerekli formata nasıl hazırlayacağını öğreneceksin. Metin Üretimi modeli, bir karakterin konuşma tarzını çoğaltmak için kullanılır ve Sheldon’ı taklit ederek biraz eğleneceğiz. Sinirsel Makine Çevirisi, örneğin Google Translate tarafından çok daha karmaşık bir modelde kullanılır. Bu bölümde, kısa Portekizce ifadeleri İngilizce’ye çeviren bir model oluşturacaksın.

Exercise 1: Diziden Diziye Modeller Exercise 2: Metin üretimi örnekleri Exercise 3: NMT örneği Exercise 4: Metin Üreten Fonksiyon Exercise 5: Sonraki karakteri tahmin et Exercise 6: Bağlama sahip cümle üret Exercise 7: Olasılık ölçeğini değiştir Exercise 8: Metin Üretim Modelleri Exercise 9: Cümle ve sonraki karakter vektörleri oluştur Exercise 10: Eğitim için veriyi hazırlama Exercise 11: Metin üretim modelini oluşturma Exercise 12: Nöral Makine Çevirisi Exercise 13: Girdi metnini hazırlama Exercise 14: Çıktı metnini hazırlama Exercise 15: Portekizceyi İngilizceye çevir Exercise 16: Tebrikler!