Komponen dengan ekstensi
Atribut ekstensi menjadi sangat kuat jika digabungkan dengan komponen pipeline kustom. Dalam latihan ini, Anda akan menulis sebuah komponen pipeline yang menemukan nama negara dan sebuah atribut ekstensi kustom yang mengembalikan ibu kota negara tersebut, jika tersedia.
Objek nlp sudah dibuat dan kelas Span sudah diimpor. Sebuah phrase matcher dengan seluruh negara tersedia sebagai variabel matcher. Sebuah kamus yang memetakan negara ke kota ibu kotanya tersedia sebagai variabel capitals.
Latihan ini adalah bagian dari kursus
NLP Lanjutan dengan spaCy
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
def countries_component(doc):
# Create an entity Span with the label 'GPE' for all matches
doc.ents = [____(____, ____, ____, label=____)
for match_id, start, end in matcher(doc)]
return doc
# Add the component to the pipeline
____.____(____)
print(nlp.pipe_names)