POS tagging dengan spaCy
Dalam latihan ini, Anda akan berlatih POS tagging. POS tagging merupakan alat yang berguna dalam NLP karena memungkinkan algoritma memahami struktur gramatikal suatu kalimat dan mengidentifikasi kata-kata yang memiliki banyak makna seperti watch dan play.
Untuk latihan ini, en_core_web_sm telah dimuat untuk Anda sebagai nlp. Tiga komentar dari himpunan data Airline Travel Information System (ATIS) telah disediakan untuk Anda dalam sebuah daftar bernama texts.
Latihan ini adalah bagian dari kursus
Pemrosesan Bahasa Alami dengan spaCy
Petunjuk latihan
- Susun
documents, sebuah daftar berisi semua kontainerdocuntuk setiap teks dalam daftartextsmenggunakan list comprehension. - Untuk setiap kontainer
doc, cetak teks setiap token beserta tag POS yang sesuai dengan mengiterasidocumentsdan token dari tiap kontainerdocmenggunakan for loop bersarang.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Compile a list of all Doc containers of texts
documents = [____(text) for text in texts]
# Print token texts and POS tags for each Doc container
for doc in documents:
for ____ in doc:
print("Text: ", ____, "| POS tag: ", ____)
print("\n")