Exemplo de NMT
Esse exercício quer dar uma continuidade à prévia que você teve do NMT no começo do curso. Você vai continuar traduzindo pequenas frases de português para o inglês.
Algumas frases de exemplo estão disponíveis na variável sentences e são impressas no console.
Além disso, tem um modelo pré-treinado disponível na variável model e você vai usar duas funções personalizadas pra simplificar algumas etapas:
encode_sequences(): Transforme textos em uma sequência de índices numéricos e preencha-os.translate_many(): Usa o modelo pré-treinado para traduzir uma lista de frases do português para o inglês. Mais tarde, você mesmo vai programar essa função.
Para mais detalhes sobre as funções, dá uma olhada em help(). O pacote pandas é carregado como pd.
Este exercício faz parte do curso
Redes Neurais Recorrentes (RNNs) para Modelagem de Linguagem com Keras
Instruções do exercício
- Use a função “
encode_sequences()” para pré-processar os textos e salvar os resultados na variável “X”. - Traduza o
sentencesusando a funçãotranslate_many()passandoXcomo parâmetro. - Crie uma planilha do Excel com o nome “
pd.DataFrame()” com as listas originais e traduzidas como colunas. - Imprima a estrutura de dados.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Transform text into sequence of indexes and pad
X = ____(sentences)
# Print the sequences of indexes
print(X)
# Translate the sentences
translated = translate_many(model, ____)
# Create pandas DataFrame with original and translated
df = pd.DataFrame({'Original': ____, 'Translated': ____})
# Print the DataFrame
print(____)