BaşlayınÜcretsiz Başlayın

spaCy ile Tokenization

Bu egzersizde metin tokenization pratiği yapacaksın. Bu egzersiz için Amazon Fine Food Reviews veri kümesindeki ilk yorumu kullanacaksın. Bu yoruma sağlanan text nesnesini kullanarak erişebilirsin.

en_core_web_sm modeli senin için zaten yüklendi. nlp() çağırarak erişebilirsin. Çıktı listelerini oluşturmak için liste üreteci (list comprehension) kullanabilirsin.

Bu egzersiz

spaCy ile Natural Language Processing

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Önceden yüklenmiş yoruma ait Doc kapsayıcısını bir document nesnesinde sakla.
  • document içindeki tüm token'ların metinlerini first_text_tokens değişkeninde sakla ve incele.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create a Doc container of the given text
document = ____(____)
    
# Store and review the token text values of tokens for the Doc container
first_text_tokens = [____ for ____ in ____]
print("First text tokens:\n", first_text_tokens, "\n")
Kodu Düzenle ve Çalıştır