Construindo um modelo LSTM para texto
Na PyBooks, a equipe está sempre buscando melhorar a experiência do usuário aproveitando os avanços mais recentes em tecnologia. Alinhado a essa visão, atribuíram a você uma tarefa crítica. A equipe quer que você explore o potencial de outra ferramenta poderosa: LSTM, conhecida por capturar mais complexidades nos padrões dos dados. Você está trabalhando com o mesmo conjunto de dados Newsgroup, com o mesmo objetivo: classificar artigos de notícias em três categorias distintas:
rec.autos, sci.med e comp.graphics.
Os seguintes pacotes já foram carregados para você: torch, nn, optim.
Este exercício faz parte do curso
Deep Learning para Texto com PyTorch
Instruções do exercício
- Configure um modelo LSTM completando as camadas LSTM e linear com os parâmetros necessários.
- Inicialize o modelo com os parâmetros necessários.
- Treine o modelo LSTM zerando os gradientes e passando os dados de entrada
X_train_seqpelo modelo. - Calcule a perda com base nos
outputsprevistos e nos rótulos verdadeiros.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Initialize the LSTM and the output layer with parameters
class LSTMModel(nn.Module):
def __init__(self, input_size, hidden_size, num_layers, num_classes):
super(LSTMModel, self).__init__()
self.hidden_size = hidden_size
self.num_layers = num_layers
self.lstm = nn.LSTM(____, ____, ____, batch_first=True)
self.fc = nn.Linear(____, ____)
def forward(self, x):
h0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size)
c0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size)
out, _ = self.lstm(x, (h0, c0))
out = out[:, -1, :]
out = self.fc(out)
return out
# Initialize model with required parameters
lstm_model = LSTMModel(____, ____, ____, ____)
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(lstm_model.parameters(), lr=0.01)
# Train the model by passing the correct parameters and zeroing the gradient
for epoch in range(10):
optimizer.____
outputs = lstm_model(____)
loss = criterion(____, y_train_seq)
loss.backward()
optimizer.step()
print(f'Epoch: {epoch+1}, Loss: {loss.item()}')