BaşlayınÜcretsiz Başlayın

Cümle ve sonraki karakter vektörleri oluştur

Bu egzersizin amacı veri hazırlamanın değerini daha da vurgulamaktır. Girdi olarak The Big Bang Theory dizisindeki Sheldon karakterinin ifadelerini içeren metinleri kullanacak ve bir metin üretim modeli oluşturmadan önce gereken cümle indeksleri ve sonraki karakterlerin vektörlerini oluşturacaksın.

Metin sheldon değişkeninde, söz varlığı (karakterler) vocabulary değişkeninde ve chars_window ile step hiperparametreleri de 20 ve 3 değerleriyle tanımlanmış durumda. Bu, 20 karakterlik bir dizinin bir sonraki karakteri tahmin etmek için kullanılacağı ve pencerenin her yinelemede 3 karakter kayacağı anlamına gelir.

Ayrıca, pandas paketi ortamda pd olarak yüklüdür.

Bu egzersiz

Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Döngü kurmak için metni satır sonlarına göre böl.
  • Cümlenin sonundan chars_window çıkarılana kadar döngüyü sürdür.
  • chars_window uzunluğunda cümle bölümünü sentences değişkenine ve bir sonraki karakteri next_chars değişkenine ekle.
  • Elde edilen vektörleri kullanarak bir pd.DataFrame() oluştur ve ilk satırlarını yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Instantiate the vectors
sentences = []
next_chars = []
# Loop for every sentence
for sentence in sheldon.____:
    # Get 20 previous chars and next char; then shift by step
    for i in range(0, len(sentence) - ____, step):
        sentences.append(sentence[i:i + ____])
        next_chars.append(sentence[____ + chars_window])

# Define a Data Frame with the vectors
df = pd.DataFrame({'sentence': ____, 'next_char': ____})

# Print the initial rows
print(df.head())
Kodu Düzenle ve Çalıştır