Podział danych na treningowe i walidacyjne

Stworzysz zbiory danych treningowych i walidacyjnych. Wydzielenie zbioru walidacyjnego i monitorowanie na nim wyników modelu to dobra praktyka, która pomaga unikać przeuczenia (overfittingu).

W tym ćwiczeniu masz do dyspozycji zmienne en_text (zdania w języku angielskim) i fr_text (zdania w języku francuskim).

Zdefiniuj sekwencję indeksów za pomocą np.arange(), zaczynającą się od 0 i o rozmiarze równym długości en_text.
Zdefiniuj train_inds jako pierwsze train_size indeksów z tej sekwencji.
Zdefiniuj tr_en i tf_fr, które zawierają zdania znajdujące się pod indeksami określonymi przez train_inds w listach en_text i fr_text.
Zdefiniuj v_en i v_fr, które zawierają zdania znajdujące się pod indeksami określonymi przez valid_inds w listach en_text i fr_text.

ćwiczenie

Podział danych na treningowe i walidacyjne

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie