Aggiungere la testa del transformer
È il momento di progettare una testa per transformer da usare in compiti di classificazione come l’analisi del sentiment o la categorizzazione. Definirai una classe ClassifierHead, creerai le istanze del corpo e della testa, e passerai una sequenza di ID di token attraverso entrambi per verificare che funzionino come previsto.
Nota: poiché questo modello non è ancora stato addestrato, i risultati non avranno significato; tuttavia, verificare che il codice sappia elaborare gli input e generare gli output nel formato atteso è un buon test.
Questo esercizio fa parte del corso
Modelli Transformer con PyTorch
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Complete the classification head
class ClassifierHead(nn.Module):
def __init__(self, d_model, num_classes):
super().__init__()
self.fc = ____
def forward(self, x):
logits = self.fc(x)
return F.____(logits, dim=-1)