Construindo um modelo GRU para texto
Na PyBooks, a equipe ficou impressionada com o desempenho dos dois modelos que você treinou anteriormente. No entanto, em busca da excelência, eles querem garantir a escolha do melhor modelo possível para a tarefa. Por isso, pediram que você ampliasse o projeto experimentando as capacidades dos modelos GRU, conhecidos por sua eficiência e eficácia em tarefas de classificação de texto. Sua nova missão é aplicar o modelo GRU para classificar artigos do conjunto de dados Newsgroup nas seguintes categorias:
rec.autos, sci.med e comp.graphics.
Os seguintes pacotes já foram carregados para você: torch, nn, optim.
Este exercício faz parte do curso
Deep Learning para Texto com PyTorch
Instruções do exercício
- Complete a classe GRU com os parâmetros necessários.
- Inicialize o modelo com os mesmos parâmetros.
- Treine o modelo: passe os parâmetros para a função de critério e faça a retropropagação da perda.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Complete the GRU model
class GRUModel(nn.Module):
def __init__(self, input_size, hidden_size, num_layers, num_classes):
super(GRUModel, self).__init__()
self.hidden_size = hidden_size
self.num_layers = num_layers
self.gru = ____
self.fc = nn.Linear(hidden_size, num_classes)
def forward(self, x):
h0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size)
out, _ = self.gru(x, h0)
out = out[:, -1, :]
out = self.fc(out)
return out
# Initialize the model
gru_model = ____
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(gru_model.parameters(), lr=0.01)
# Train the model and backpropagate the loss after initialization
for epoch in range(15):
optimizer.zero_grad()
outputs = ____
loss = criterion(____, y_train_seq)
____
optimizer.step()
print(f'Epoch: {epoch+1}, Loss: {loss.item()}')