Gettysburg Konuşması'nı Tokenize Etme
Bu egzersizde, Amerikan İç Savaşı sırasında ABD Başkanı Abraham Lincoln'ün yaptığı, tarihin en ünlü konuşmalarından biri olan Gettysburg Konuşması'nı tokenize edeceksin.
Konuşmanın tamamı gettysburg adlı bir string olarak verilmiştir.
Bu egzersiz, kursun bir parçasıdır
Python ile NLP için Özellik Mühendisliği
Egzersiz talimatları
spacy.load()kullanaraken_core_web_smmodelini yükle.gettysburgstring'i içindocadlı bir Doc nesnesi oluştur.- Liste üreteci (list comprehension) ile
docüzerinde dolaşarak belirteç metinlerini üret.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
import spacy
# Load the en_core_web_sm model
nlp = ____.____(____)
# Create a Doc object
doc = ____(____)
# Generate the tokens
tokens = [token.____ for token in ____]
print(tokens)