spaCy söz varlığı
Kelime vektörleri (word embeddings), metin verisi kullanarak bilgisayarların karmaşık görevleri gerçekleştirmesini sağlayan, kelimelerin sayısal temsilleridir. Pek çok spaCy modeli kelime vektörleri içerir; ancak bazı modellerde kelime vektörleri yoktur.
Bu egzersizde, spaCy söz varlığı bilgilerine erişmeyi pratik edeceksin. Kelime vektörleriyle ilgili bazı meta bilgiler her spaCy modelinde tutulur. Bu bilgilere erişerek söz varlığı boyutu, kelime vektörü boyutları vb. hakkında daha fazla şey öğrenebilirsin.
spaCy paketi senin için zaten içe aktarıldı. Bir spaCy modelinin meta verilerinde, kelime sayısı "vectors" anahtarına sahip bir öğe olarak ve kelime vektörlerinin boyutu "width" anahtarına sahip bir öğe olarak saklanır.
Bu egzersiz
spaCy ile Natural Language Processing
kursunun bir parçasıdırEgzersiz talimatları
en_core_web_mdmodelini yükle.en_core_web_mdmodelinin söz varlığındaki kelime sayısını yazdır.en_core_web_mdmodelindeki kelime vektörlerinin boyutlarını yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Load the en_core_web_md model
md_nlp = ____
# Print the number of words in the model's vocabulary
print("Number of words: ", md_nlp.____["vectors"]["vectors"], "\n")
# Print the dimensions of word vectors in en_core_web_md model
print("Dimension of word vectors: ", md_nlp.____["vectors"]["width"])