Entitas dan ekstensi
Dalam latihan ini, Anda akan menggabungkan atribut ekstensi kustom dengan prediksi model dan membuat sebuah attribute getter yang mengembalikan URL pencarian Wikipedia jika span tersebut adalah orang, organisasi, atau lokasi.
Kelas Span sudah diimpor dan objek nlp telah dibuat untuk Anda.
Latihan ini adalah bagian dari kursus
NLP Lanjutan dengan spaCy
Petunjuk latihan
- Lengkapi getter
get_wikipedia_urlagar hanya mengembalikan URL jika label span ada dalam daftar label. - Atur ekstensi
Span'wikipedia_url'menggunakan getterget_wikipedia_url. - Iterasikan entitas dalam
docdan keluarkan URL Wikipedia mereka.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
def get_wikipedia_url(span):
# Get a Wikipedia URL if the span has one of the labels
if ____ in ('PERSON', 'ORG', 'GPE', 'LOCATION'):
entity_text = span.text.replace(' ', '_')
return "https://en.wikipedia.org/w/index.php?search=" + entity_text
# Set the Span extension wikipedia_url using get getter get_wikipedia_url
____.____(____, ____=____)
doc = nlp("In over fifty years from his very first recordings right through to his last album, David Bowie was at the vanguard of contemporary culture.")
for ent in doc.ents:
# Print the text and Wikipedia URL of the entity
print(____, ____)