BaşlayınÜcretsiz Başlayın

Eğitim ve doğrulama verilerini ayırma

Eğitim ve doğrulama veri kümeleri oluşturacaksın. Bir doğrulama veri kümesi tutmak ve modelin bu küme üzerindeki performansını izlemek, overfittingi önlemek için iyi bir pratiktir.

Bu egzersiz için sana en_text (İngilizce cümleler) ve fr_text (Fransızca cümleler) sağlandı.

Bu egzersiz

Keras ile Machine Translation

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • np.arange() kullanarak 0'dan başlayan ve boyutu en_text olan bir indis dizisi tanımla.
  • train_inds'i, bu indis dizisinin ilk train_size'lık kısmı olarak tanımla.
  • tr_en ve tf_fr'yi, train_inds içinde belirtilen indislerde yer alan cümleleri sırasıyla en_text ve fr_text listelerinden alacak şekilde tanımla.
  • v_en ve v_fr'yi, valid_inds içinde belirtilen indislerde yer alan cümleleri sırasıyla en_text ve fr_text listelerinden alacak şekilde tanımla.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

train_size, valid_size = 800, 200
# Define a sequence of indices from 0 to size of en_text
inds = np.____(len(____))
np.random.shuffle(inds)
# Define train_inds as first train_size indices
train_inds = inds[:____]
valid_inds = inds[train_size:train_size+valid_size]
# Define tr_en (train EN sentences) and tr_fr (train FR sentences)
tr_en = [en_text[ti] for ti in ____]
tr_fr = [____[____] for ti in ____]
# Define v_en (valid EN sentences) and v_fr (valid FR sentences)
v_en = [en_text[____] for vi in ____]
v_fr = [____[____] for vi in ____]
print('Training (EN):\n', tr_en[:3], '\nTraining (FR):\n', tr_fr[:3])
print('\nValid (EN):\n', v_en[:3], '\nValid (FR):\n', v_fr[:3])
Kodu Düzenle ve Çalıştır