Construindo um modelo LSTM para texto

Na PyBooks, a equipe está sempre buscando melhorar a experiência do usuário aproveitando os avanços mais recentes em tecnologia. Alinhado a essa visão, atribuíram a você uma tarefa crítica. A equipe quer que você explore o potencial de outra ferramenta poderosa: LSTM, conhecida por capturar mais complexidades nos padrões dos dados. Você está trabalhando com o mesmo conjunto de dados Newsgroup, com o mesmo objetivo: classificar artigos de notícias em três categorias distintas:

rec.autos, sci.med e comp.graphics.

Os seguintes pacotes já foram carregados para você: torch, nn, optim.

Este exercício faz parte do curso

Deep Learning para Texto com PyTorch

Ver curso

Instruções do exercício

Configure um modelo LSTM completando as camadas LSTM e linear com os parâmetros necessários.
Inicialize o modelo com os parâmetros necessários.
Treine o modelo LSTM zerando os gradientes e passando os dados de entrada X_train_seq pelo modelo.
Calcule a perda com base nos outputs previstos e nos rótulos verdadeiros.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Initialize the LSTM and the output layer with parameters
class LSTMModel(nn.Module):
    def __init__(self, input_size, hidden_size, num_layers, num_classes):
        super(LSTMModel, self).__init__()
        self.hidden_size = hidden_size
        self.num_layers = num_layers
        self.lstm = nn.LSTM(____, ____, ____, batch_first=True)
        self.fc = nn.Linear(____, ____)        
    def forward(self, x):
        h0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size)
        c0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size)
        out, _ = self.lstm(x, (h0, c0))
        out = out[:, -1, :] 
        out = self.fc(out)
        return out

# Initialize model with required parameters
lstm_model = LSTMModel(____, ____, ____, ____)
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(lstm_model.parameters(), lr=0.01)

# Train the model by passing the correct parameters and zeroing the gradient
for epoch in range(10): 
    optimizer.____
    outputs = lstm_model(____)
    loss = criterion(____, y_train_seq)
    loss.backward()
    optimizer.step()
    print(f'Epoch: {epoch+1}, Loss: {loss.item()}')

Editar e executar o código