spaCy ile Tokenization
Bu egzersizde metin tokenization pratiği yapacaksın. Bu egzersiz için Amazon Fine Food Reviews veri kümesindeki ilk yorumu kullanacaksın. Bu yoruma sağlanan text nesnesini kullanarak erişebilirsin.
en_core_web_sm modeli senin için zaten yüklendi. nlp() çağırarak erişebilirsin. Çıktı listelerini oluşturmak için liste üreteci (list comprehension) kullanabilirsin.
Bu egzersiz
spaCy ile Natural Language Processing
kursunun bir parçasıdırEgzersiz talimatları
- Önceden yüklenmiş yoruma ait Doc kapsayıcısını bir
documentnesnesinde sakla. documentiçindeki tüm token'ların metinlerinifirst_text_tokensdeğişkeninde sakla ve incele.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create a Doc container of the given text
document = ____(____)
# Store and review the token text values of tokens for the Doc container
first_text_tokens = [____ for ____ in ____]
print("First text tokens:\n", first_text_tokens, "\n")