NMT-voorbeeld
In deze oefening bouw je voort op de sneak peek van NMT aan het begin van de cursus. Je gaat verder met het vertalen van korte Portugese zinnen naar Engels.
Een paar voorbeeldzinnen staan in de variabele sentences en worden in de console afgedrukt.
Er is ook een voorgetraind model beschikbaar in de variabele model en je gebruikt twee aangepaste functies om een paar stappen te vereenvoudigen:
encode_sequences(): Zet tekst om naar reeksen numerieke indexen en voert padding uit.translate_many(): Gebruikt het voorgetrainde model om een lijst zinnen van het Portugees naar het Engels te vertalen. Later ga je deze functie zelf schrijven.
Voor meer details over de functies, gebruik help(). Het pakket pandas is geladen als pd.
Deze oefening maakt deel uit van de cursus
Recurrent Neural Networks (RNN's) voor taalmodellen met Keras
Oefeninstructies
- Gebruik de functie
encode_sequences()om de teksten te pre-processen en sla de resultaten op in de variabeleX. - Vertaal de
sentencesmet de functietranslate_many()doorXals parameter mee te geven. - Maak een
pd.DataFrame()met de oorspronkelijke en vertaalde lijsten als kolommen. - Print het data frame.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Transform text into sequence of indexes and pad
X = ____(sentences)
# Print the sequences of indexes
print(X)
# Translate the sentences
translated = translate_many(model, ____)
# Create pandas DataFrame with original and translated
df = pd.DataFrame({'Original': ____, 'Translated': ____})
# Print the DataFrame
print(____)