MulaiMulai sekarang secara gratis

POS tagging dengan spaCy

Dalam latihan ini, Anda akan berlatih POS tagging. POS tagging merupakan alat yang berguna dalam NLP karena memungkinkan algoritma memahami struktur gramatikal suatu kalimat dan mengidentifikasi kata-kata yang memiliki banyak makna seperti watch dan play.

Untuk latihan ini, en_core_web_sm telah dimuat untuk Anda sebagai nlp. Tiga komentar dari himpunan data Airline Travel Information System (ATIS) telah disediakan untuk Anda dalam sebuah daftar bernama texts.

Latihan ini adalah bagian dari kursus

Pemrosesan Bahasa Alami dengan spaCy

Lihat Kursus

Petunjuk latihan

  • Susun documents, sebuah daftar berisi semua kontainer doc untuk setiap teks dalam daftar texts menggunakan list comprehension.
  • Untuk setiap kontainer doc, cetak teks setiap token beserta tag POS yang sesuai dengan mengiterasi documents dan token dari tiap kontainer doc menggunakan for loop bersarang.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Compile a list of all Doc containers of texts
documents = [____(text) for text in texts]

# Print token texts and POS tags for each Doc container
for doc in documents:
    for ____ in doc:
        print("Text: ", ____, "| POS tag: ", ____)
    print("\n")
Edit dan Jalankan Kode