Cümle ve sonraki karakter vektörleri oluştur
Bu egzersizin amacı veri hazırlamanın değerini daha da vurgulamaktır. Girdi olarak The Big Bang Theory dizisindeki Sheldon karakterinin ifadelerini içeren metinleri kullanacak ve bir metin üretim modeli oluşturmadan önce gereken cümle indeksleri ve sonraki karakterlerin vektörlerini oluşturacaksın.
Metin sheldon değişkeninde, söz varlığı (karakterler) vocabulary değişkeninde ve chars_window ile step hiperparametreleri de 20 ve 3 değerleriyle tanımlanmış durumda. Bu, 20 karakterlik bir dizinin bir sonraki karakteri tahmin etmek için kullanılacağı ve pencerenin her yinelemede 3 karakter kayacağı anlamına gelir.
Ayrıca, pandas paketi ortamda pd olarak yüklüdür.
Bu egzersiz
Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)
kursunun bir parçasıdırEgzersiz talimatları
- Döngü kurmak için metni satır sonlarına göre böl.
- Cümlenin sonundan
chars_windowçıkarılana kadar döngüyü sürdür. chars_windowuzunluğunda cümle bölümünüsentencesdeğişkenine ve bir sonraki karakterinext_charsdeğişkenine ekle.- Elde edilen vektörleri kullanarak bir
pd.DataFrame()oluştur ve ilk satırlarını yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Instantiate the vectors
sentences = []
next_chars = []
# Loop for every sentence
for sentence in sheldon.____:
# Get 20 previous chars and next char; then shift by step
for i in range(0, len(sentence) - ____, step):
sentences.append(sentence[i:i + ____])
next_chars.append(sentence[____ + chars_window])
# Define a Data Frame with the vectors
df = pd.DataFrame({'sentence': ____, 'next_char': ____})
# Print the initial rows
print(df.head())