1. Nauka
  2. /
  3. Kursy
  4. /
  5. Tłumaczenie maszynowe z Keras

Connected

ćwiczenie

Podział danych na treningowe i walidacyjne

Stworzysz zbiory danych treningowych i walidacyjnych. Wydzielenie zbioru walidacyjnego i monitorowanie na nim wyników modelu to dobra praktyka, która pomaga unikać przeuczenia (overfittingu).

W tym ćwiczeniu masz do dyspozycji zmienne en_text (zdania w języku angielskim) i fr_text (zdania w języku francuskim).

Instrukcje

100 XP
  • Zdefiniuj sekwencję indeksów za pomocą np.arange(), zaczynającą się od 0 i o rozmiarze równym długości en_text.
  • Zdefiniuj train_inds jako pierwsze train_size indeksów z tej sekwencji.
  • Zdefiniuj tr_en i tf_fr, które zawierają zdania znajdujące się pod indeksami określonymi przez train_inds w listach en_text i fr_text.
  • Zdefiniuj v_en i v_fr, które zawierają zdania znajdujące się pod indeksami określonymi przez valid_inds w listach en_text i fr_text.