Mengekstrak negara dan relasi
Pada latihan sebelumnya, Anda menulis skrip menggunakan PhraseMatcher milik spaCy untuk menemukan nama negara dalam teks. Mari gunakan pencari frasa negara tersebut pada teks yang lebih panjang, analisis sintaksisnya, dan perbarui entitas dokumen dengan negara-negara yang cocok. Objek nlp sudah dibuat.
Teks tersedia sebagai variabel text, PhraseMatcher dengan pola negara tersedia sebagai variabel matcher. Kelas Span sudah diimpor.
Latihan ini adalah bagian dari kursus
NLP Lanjutan dengan spaCy
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a doc and find matches in it
doc = ____
# Iterate over the matches
for match_id, start, end in matcher(doc):
# Create a Span with the label for "GPE"
span = ____(____, ____, ____, label=____)
# Overwrite the doc.ents and add the span
doc.ents = list(doc.ents) + [____]
# Print the entities in the document
print([(ent.text, ent.label_) for ent in doc.ents if ent.label_ == 'GPE'])