Eğitim ve doğrulama verilerini ayırma
Eğitim ve doğrulama veri kümeleri oluşturacaksın. Bir doğrulama veri kümesi tutmak ve modelin bu küme üzerindeki performansını izlemek, overfittingi önlemek için iyi bir pratiktir.
Bu egzersiz için sana en_text (İngilizce cümleler) ve fr_text (Fransızca cümleler) sağlandı.
Bu egzersiz
Keras ile Machine Translation
kursunun bir parçasıdırEgzersiz talimatları
np.arange()kullanarak 0'dan başlayan ve boyutuen_textolan bir indis dizisi tanımla.train_inds'i, bu indis dizisinin ilktrain_size'lık kısmı olarak tanımla.tr_envetf_fr'yi,train_indsiçinde belirtilen indislerde yer alan cümleleri sırasıylaen_textvefr_textlistelerinden alacak şekilde tanımla.v_envev_fr'yi,valid_indsiçinde belirtilen indislerde yer alan cümleleri sırasıylaen_textvefr_textlistelerinden alacak şekilde tanımla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
train_size, valid_size = 800, 200
# Define a sequence of indices from 0 to size of en_text
inds = np.____(len(____))
np.random.shuffle(inds)
# Define train_inds as first train_size indices
train_inds = inds[:____]
valid_inds = inds[train_size:train_size+valid_size]
# Define tr_en (train EN sentences) and tr_fr (train FR sentences)
tr_en = [en_text[ti] for ti in ____]
tr_fr = [____[____] for ti in ____]
# Define v_en (valid EN sentences) and v_fr (valid FR sentences)
v_en = [en_text[____] for vi in ____]
v_fr = [____[____] for vi in ____]
print('Training (EN):\n', tr_en[:3], '\nTraining (FR):\n', tr_fr[:3])
print('\nValid (EN):\n', v_en[:3], '\nValid (FR):\n', v_fr[:3])