Gettysburg Konuşması'nı Tokenize Etme
Bu egzersizde, Amerikan İç Savaşı sırasında ABD Başkanı Abraham Lincoln'ün yaptığı, tarihin en ünlü konuşmalarından biri olan Gettysburg Konuşması'nı tokenize edeceksin.
Konuşmanın tamamı gettysburg adlı bir string olarak verilmiştir.
Bu egzersiz
Python ile NLP için Özellik Mühendisliği
kursunun bir parçasıdırEgzersiz talimatları
spacy.load()kullanaraken_core_web_smmodelini yükle.gettysburgstring'i içindocadlı bir Doc nesnesi oluştur.- Liste üreteci (list comprehension) ile
docüzerinde dolaşarak belirteç metinlerini üret.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
import spacy
# Load the en_core_web_sm model
nlp = ____.____(____)
# Create a Doc object
doc = ____(____)
# Generate the tokens
tokens = [token.____ for token in ____]
print(tokens)