BaşlayınÜcretsiz başlayın

spaCy ile Tokenization

Bu egzersizde metin tokenization pratiği yapacaksın. Bu egzersiz için Amazon Fine Food Reviews veri kümesindeki ilk yorumu kullanacaksın. Bu yoruma sağlanan text nesnesini kullanarak erişebilirsin.

en_core_web_sm modeli senin için zaten yüklendi. nlp() çağırarak erişebilirsin. Çıktı listelerini oluşturmak için liste üreteci (list comprehension) kullanabilirsin.

Bu egzersiz, kursun bir parçasıdır

spaCy ile Natural Language Processing

Kursa Göz Atın

Egzersiz talimatları

  • Önceden yüklenmiş yoruma ait Doc kapsayıcısını bir document nesnesinde sakla.
  • document içindeki tüm token'ların metinlerini first_text_tokens değişkeninde sakla ve incele.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Create a Doc container of the given text
document = ____(____)
    
# Store and review the token text values of tokens for the Doc container
first_text_tokens = [____ for ____ in ____]
print("First text tokens:\n", first_text_tokens, "\n")
Kodu Düzenle ve Çalıştır