MulaiMulai sekarang secara gratis

Kosakata spaCy

Word vectors, atau word embeddings, adalah representasi numerik dari kata-kata yang memungkinkan komputer melakukan tugas kompleks menggunakan data teks. Word vectors merupakan bagian dari banyak model spaCy; namun, beberapa model tidak memiliki word vectors.

Dalam latihan ini, Anda akan berlatih mengakses informasi kosakata spaCy. Sejumlah meta-informasi tentang word vectors disimpan di setiap model spaCy. Anda dapat mengakses informasi ini untuk mempelajari lebih lanjut tentang ukuran kosakata, dimensi vektor kata, dan sebagainya.

Paket spaCy sudah diimpor untuk Anda. Dalam metadata model spaCy, jumlah kata disimpan sebagai elemen dengan kunci "vectors" dan dimensi vektor kata disimpan sebagai elemen dengan kunci "width".

Latihan ini adalah bagian dari kursus

Pemrosesan Bahasa Alami dengan spaCy

Lihat Kursus

Petunjuk latihan

  • Muat model en_core_web_md.
  • Cetak jumlah kata dalam kosakata model en_core_web_md.
  • Cetak dimensi vektor kata dalam model en_core_web_md.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Load the en_core_web_md model
md_nlp = ____

# Print the number of words in the model's vocabulary
print("Number of words: ", md_nlp.____["vectors"]["vectors"], "\n")

# Print the dimensions of word vectors in en_core_web_md model
print("Dimension of word vectors: ", md_nlp.____["vectors"]["width"])
Edit dan Jalankan Kode