Kontainer Doc di spaCy
Langkah pertama dalam pipeline pemrosesan teks spaCy adalah mengonversi string teks menjadi kontainer Doc, yang menyimpan teks yang telah diproses. Pada latihan ini, Anda akan mempraktikkan memuat model spaCy, membuat objek nlp(), membuat kontainer Doc, serta memroses string text yang sudah disediakan.
Model en_core_web_sm sudah diunduh.
Latihan ini adalah bagian dari kursus
Pemrosesan Bahasa Alami dengan spaCy
Petunjuk latihan
- Muat
en_core_web_smdan buat objeknlp. - Buat kontainer
docdari stringtext. - Buat sebuah list yang berisi teks dari setiap token dalam kontainer
doc.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load en_core_web_sm and create an nlp object
nlp = spacy.____(____)
# Create a Doc container for the text object
doc = ____(____)
# Create a list containing the text of each token in the Doc container
print([____ for ____ in ____])