Eğitim ve doğrulama verilerini ayırma

Eğitim ve doğrulama veri kümeleri oluşturacaksın. Bir doğrulama veri kümesi tutmak ve modelin bu küme üzerindeki performansını izlemek, overfittingi önlemek için iyi bir pratiktir.

Bu egzersiz için sana en_text (İngilizce cümleler) ve fr_text (Fransızca cümleler) sağlandı.

Bu egzersiz, kursun bir parçasıdır

Keras ile Machine Translation

Kursa Göz Atın

Egzersiz talimatları

np.arange() kullanarak 0'dan başlayan ve boyutu en_text olan bir indis dizisi tanımla.
train_inds'i, bu indis dizisinin ilk train_size'lık kısmı olarak tanımla.
tr_en ve tf_fr'yi, train_inds içinde belirtilen indislerde yer alan cümleleri sırasıyla en_text ve fr_text listelerinden alacak şekilde tanımla.
v_en ve v_fr'yi, valid_inds içinde belirtilen indislerde yer alan cümleleri sırasıyla en_text ve fr_text listelerinden alacak şekilde tanımla.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

train_size, valid_size = 800, 200
# Define a sequence of indices from 0 to size of en_text
inds = np.____(len(____))
np.random.shuffle(inds)
# Define train_inds as first train_size indices
train_inds = inds[:____]
valid_inds = inds[train_size:train_size+valid_size]
# Define tr_en (train EN sentences) and tr_fr (train FR sentences)
tr_en = [en_text[ti] for ti in ____]
tr_fr = [____[____] for ti in ____]
# Define v_en (valid EN sentences) and v_fr (valid FR sentences)
v_en = [en_text[____] for vi in ____]
v_fr = [____[____] for vi in ____]
print('Training (EN):\n', tr_en[:3], '\nTraining (FR):\n', tr_fr[:3])
print('\nValid (EN):\n', v_en[:3], '\nValid (FR):\n', v_fr[:3])

Kodu Düzenle ve Çalıştır