One-hot gecodeerde boektitels
PyBooks wil de boekgenres in zijn bibliotheek catalogiseren en analyseren. Pas one-hot encoding toe op een lijst met boekgenres om ze machineleesbaar te maken.
torch is al voor je geïmporteerd.
Deze oefening maakt deel uit van de cursus
Deep Learning voor tekst met PyTorch
Oefeninstructies
- Definieer de grootte van de woordenschat en sla deze op in
vocab_size. - Maak one-hotvectoren met de juiste
torch-techniek envocab_size. - Maak een woordenboek dat genres koppelt aan hun bijbehorende one-hotvectoren met dictionary comprehension; de sleutels van het woordenboek moeten het genre zijn.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
genres = ['Fiction','Non-fiction','Biography', 'Children','Mystery']
# Define the size of the vocabulary
vocab_size = ____(____)
# Create one-hot vectors
one_hot_vectors = torch.____(____)
# Create a dictionary mapping genres to their one-hot vectors
one_hot_dict = {____: ____[i] for i, genre in enumerate(genres)}
for genre, vector in one_hot_dict.items():
print(f'{genre}: {vector.numpy()}')