BaşlayınÜcretsiz Başlayın

Gettysburg Konuşması'nı Tokenize Etme

Bu egzersizde, Amerikan İç Savaşı sırasında ABD Başkanı Abraham Lincoln'ün yaptığı, tarihin en ünlü konuşmalarından biri olan Gettysburg Konuşması'nı tokenize edeceksin.

Konuşmanın tamamı gettysburg adlı bir string olarak verilmiştir.

Bu egzersiz

Python ile NLP için Özellik Mühendisliği

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • spacy.load() kullanarak en_core_web_sm modelini yükle.
  • gettysburg string'i için doc adlı bir Doc nesnesi oluştur.
  • Liste üreteci (list comprehension) ile doc üzerinde dolaşarak belirteç metinlerini üret.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

import spacy

# Load the en_core_web_sm model
nlp = ____.____(____)

# Create a Doc object
doc = ____(____)

# Generate the tokens
tokens = [token.____ for token in ____]
print(tokens)
Kodu Düzenle ve Çalıştır