spaCy söz varlığında kelime vektörleri
Kelime vektörlerinin amacı, bilgisayarın kelimeleri anlayabilmesini sağlamaktır. Bu egzersizde, verilen bir kelime listesi için kelime vektörlerini çıkarmayı pratik edeceksin.
Bir kelime listesi words olarak derlendi. en_core_web_md modeli önceden içe aktarılmış durumda ve nlp olarak kullanılabilir.
en_core_web_md modelinin söz varlığı 20.000 kelime içerir. Bir kelime söz varlığında yoksa, ilgili kelime vektörünü çıkaramazsın. Bu egzersizde basitlik adına, verilen tüm kelimelerin bu modelin söz varlığında bulunduğu garanti edilmiştir.
Bu egzersiz, kursun bir parçasıdır
spaCy ile Natural Language Processing
Egzersiz talimatları
- Verilen
wordsiçindeki tüm kelimelerin ID'lerini çıkar ve biridslistesinde sakla. idsiçindeki her ID için, kelime vektörünün ilk on elemanınıword_vectorslistesinde sakla.word_vectorsiçindeki ilk kelime vektörünün ilk on elemanını yazdır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
words = ["like", "love"]
# IDs of all the given words
ids = [nlp.____.____[w] for w in words]
# Store the first ten elements of the word vectors for each word
word_vectors = [nlp.____.____[i][:10] for i in ids]
# Print the first ten elements of the first word vector
print(____[0])