1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Traducere automată cu Keras

Connected

Bài tập

Împărțirea datelor în seturi de antrenament și validare

Vei crea seturi de date pentru antrenament și validare. Păstrarea unui set de validare și monitorizarea performanței modelului pe acel set este o practică bună pentru a evita supraajustarea (overfitting).

Pentru acest exercițiu ai la dispoziție en_text (propoziții în engleză) și fr_text (propoziții în franceză).

Hướng dẫn

100 XP
  • Definește o secvență de indici folosind np.arange(), care să înceapă de la 0 și să aibă dimensiunea egală cu en_text.
  • Definește train_inds ca primii train_size indici din secvența de indici.
  • Definește tr_en și tf_fr, care conțin propozițiile de la indicii specificați de train_inds în listele en_text și fr_text.
  • Definește v_en și v_fr, care conțin propozițiile de la indicii specificați de valid_inds în listele en_text și fr_text.