Model girişi için metin verisini hazırlama
Daha önce, kelimelerden indekslere ve tam tersine sözlükler oluşturmayı öğrendin. Bu egzersizde, metni karakterlere göre bölecek ve veriyi denetimli öğrenme için hazırlamaya devam edeceksin.
Metinleri karakterlere bölmek garip gelebilir, ama metin üretimi için sıkça yapılır. Ayrıca, veriyi hazırlama süreci aynıdır; tek fark metnin nasıl bölündüğüdür.
Sabit uzunlukta metinler ve etiketlerinden (karşılık gelen bir sonraki karakterler) oluşan eğitim verisini oluşturacaksın.
Sheldon (The Big Bang Theory) alıntılarını içeren ve sheldon_quotes değişkeninde bulunan veri kümesini kullanmaya devam edeceksin.
print_examples() fonksiyonu, verinin nasıl dönüştürüldüğünü görebilmen için çiftleri yazdırır. Ayrıntılar için help() kullan.
Bu egzersiz
Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)
kursunun bir parçasıdırEgzersiz talimatları
stepdeğerini2,chars_windowdeğerini10olarak tanımla.- Bir sonraki cümleyi
sentencesdeğişkenine ekle. - Metin
sheldoniçinde doğru konumunext_charsdeğişkenine ekle. print_examples()fonksiyonunu kullanarak10cümleyi ve bir sonraki karakterleri yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create lists to keep the sentences and the next character
sentences = [] # ~ Training data
next_chars = [] # ~ Training labels
# Define hyperparameters
step = ____ # ~ Step to take when reading the texts in characters
chars_window = ____ # ~ Number of characters to use to predict the next one
# Loop over the text: length `chars_window` per time with step equal to `step`
for i in range(0, len(sheldon_quotes) - chars_window, step):
sentences.____(sheldon_quotes[i:i + chars_window])
next_chars.append(sheldon_quotes[____])
# Print 10 pairs
print_examples(____, ____, 10)