BaşlayınÜcretsiz Başlayın

Model girişi için metin verisini hazırlama

Daha önce, kelimelerden indekslere ve tam tersine sözlükler oluşturmayı öğrendin. Bu egzersizde, metni karakterlere göre bölecek ve veriyi denetimli öğrenme için hazırlamaya devam edeceksin.

Metinleri karakterlere bölmek garip gelebilir, ama metin üretimi için sıkça yapılır. Ayrıca, veriyi hazırlama süreci aynıdır; tek fark metnin nasıl bölündüğüdür.

Sabit uzunlukta metinler ve etiketlerinden (karşılık gelen bir sonraki karakterler) oluşan eğitim verisini oluşturacaksın.

Sheldon (The Big Bang Theory) alıntılarını içeren ve sheldon_quotes değişkeninde bulunan veri kümesini kullanmaya devam edeceksin.

print_examples() fonksiyonu, verinin nasıl dönüştürüldüğünü görebilmen için çiftleri yazdırır. Ayrıntılar için help() kullan.

Bu egzersiz

Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • step değerini 2, chars_window değerini 10 olarak tanımla.
  • Bir sonraki cümleyi sentences değişkenine ekle.
  • Metin sheldon içinde doğru konumu next_chars değişkenine ekle.
  • print_examples() fonksiyonunu kullanarak 10 cümleyi ve bir sonraki karakterleri yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create lists to keep the sentences and the next character
sentences = []   # ~ Training data
next_chars = []  # ~ Training labels

# Define hyperparameters
step = ____          # ~ Step to take when reading the texts in characters
chars_window = ____ # ~ Number of characters to use to predict the next one  

# Loop over the text: length `chars_window` per time with step equal to `step`
for i in range(0, len(sheldon_quotes) - chars_window, step):
    sentences.____(sheldon_quotes[i:i + chars_window])
    next_chars.append(sheldon_quotes[____])

# Print 10 pairs
print_examples(____, ____, 10)
Kodu Düzenle ve Çalıştır