IniziaInizia gratis

Vocabolario di spaCy

I word vector, o word embedding, sono rappresentazioni numeriche delle parole che permettono ai computer di eseguire compiti complessi sui dati testuali. I word vector fanno parte di molti modelli di spaCy; tuttavia, alcuni modelli non li includono.

In questo esercizio, farai pratica ad accedere alle informazioni del vocabolario di spaCy. Alcune metainformazioni sui word vector sono memorizzate in ogni modello spaCy. Puoi consultarle per conoscere la dimensione del vocabolario, le dimensioni dei word vector, ecc.

Il pacchetto spaCy è già importato. Nei metadati di un modello spaCy, il numero di parole è memorizzato come elemento con la chiave "vectors" e la dimensione dei word vector è memorizzata come elemento con la chiave "width".

Questo esercizio fa parte del corso

Natural Language Processing con spaCy

Visualizza il corso

Istruzioni dell'esercizio

  • Carica il modello en_core_web_md.
  • Stampa il numero di parole nel vocabolario del modello en_core_web_md.
  • Stampa le dimensioni dei word vector nel modello en_core_web_md.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load the en_core_web_md model
md_nlp = ____

# Print the number of words in the model's vocabulary
print("Number of words: ", md_nlp.____["vectors"]["vectors"], "\n")

# Print the dimensions of word vectors in en_core_web_md model
print("Dimension of word vectors: ", md_nlp.____["vectors"]["width"])
Modifica ed esegui il codice