BaşlayınÜcretsiz başlayın

Gettysburg Konuşması'nı Tokenize Etme

Bu egzersizde, Amerikan İç Savaşı sırasında ABD Başkanı Abraham Lincoln'ün yaptığı, tarihin en ünlü konuşmalarından biri olan Gettysburg Konuşması'nı tokenize edeceksin.

Konuşmanın tamamı gettysburg adlı bir string olarak verilmiştir.

Bu egzersiz, kursun bir parçasıdır

Python ile NLP için Özellik Mühendisliği

Kursa Göz Atın

Egzersiz talimatları

  • spacy.load() kullanarak en_core_web_sm modelini yükle.
  • gettysburg string'i için doc adlı bir Doc nesnesi oluştur.
  • Liste üreteci (list comprehension) ile doc üzerinde dolaşarak belirteç metinlerini üret.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

import spacy

# Load the en_core_web_sm model
nlp = ____.____(____)

# Create a Doc object
doc = ____(____)

# Generate the tokens
tokens = [token.____ for token in ____]
print(tokens)
Kodu Düzenle ve Çalıştır