Word vector nel vocabolario di spaCy
Lo scopo dei word vector è permettere a un computer di comprendere le parole. In questo esercizio ti allenerai a estrarre i word vector per un determinato elenco di parole.
Un elenco di parole è stato creato come words. Il modello en_core_web_md è già importato e disponibile come nlp.
Il vocabolario del modello en_core_web_md contiene 20.000 parole. Se una parola non esiste nel vocabolario, non potrai estrarne il corrispondente word vector. In questo esercizio, per semplicità, è garantito che tutte le parole fornite esistano nel vocabolario di questo modello.
Questo esercizio fa parte del corso
Natural Language Processing con spaCy
Istruzioni dell'esercizio
- Estrai gli ID di tutte le
wordsfornite e salvali in una listaids. - Per ogni ID in
ids, salva nella listaword_vectorsi primi dieci elementi del relativo word vector. - Stampa i primi dieci elementi del primo word vector presente in
word_vectors.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
words = ["like", "love"]
# IDs of all the given words
ids = [nlp.____.____[w] for w in words]
# Store the first ten elements of the word vectors for each word
word_vectors = [nlp.____.____[i][:10] for i in ids]
# Print the first ten elements of the first word vector
print(____[0])