MulaiMulai sekarang secara gratis

Kontainer Doc di spaCy

Langkah pertama dalam pipeline pemrosesan teks spaCy adalah mengonversi string teks menjadi kontainer Doc, yang menyimpan teks yang telah diproses. Pada latihan ini, Anda akan mempraktikkan memuat model spaCy, membuat objek nlp(), membuat kontainer Doc, serta memroses string text yang sudah disediakan.

Model en_core_web_sm sudah diunduh.

Latihan ini adalah bagian dari kursus

Pemrosesan Bahasa Alami dengan spaCy

Lihat Kursus

Petunjuk latihan

  • Muat en_core_web_sm dan buat objek nlp.
  • Buat kontainer doc dari string text.
  • Buat sebuah list yang berisi teks dari setiap token dalam kontainer doc.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Load en_core_web_sm and create an nlp object
nlp = spacy.____(____)

# Create a Doc container for the text object
doc = ____(____)

# Create a list containing the text of each token in the Doc container
print([____ for ____ in ____])
Edit dan Jalankan Kode