NER in spagnolo con polyglot
Continuerai a esplorare polyglot con un po' di annotazione in spagnolo. Questo articolo non è scritto da un giornale, quindi è il tuo primo esempio di un testo più simile a un blog. Secondo te, come influisce questo nel trovare le entità?
L'oggetto Text è stato creato come txt e ogni entità è stata stampata, come puoi vedere nell'IPython Shell.
Il tuo compito è determinare quante entità contengono le parole "Márquez" o "Gabo" — si riferiscono alla stessa persona in modi diversi!
Questo esercizio fa parte del corso
Introduzione al Natural Language Processing in Python
Istruzioni dell'esercizio
- Itera su tutte le entità di
txt, usandoentcome variabile iteratore. - Verifica se l'entità contiene
"Márquez"o"Gabo". Se sì, incrementacount. Non dimenticare l'accentoáin"Márquez"! - Premi "Invia risposta" per vedere quale percentuale di entità si riferisce a Gabriel García Márquez (alias Gabo).
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Initialize the count variable: count
count = 0
# Iterate over all the entities
____
# Check whether the entity contains 'Márquez' or 'Gabo'
____
# Increment count
____
# Print count
print(count)
# Calculate the percentage of entities that refer to "Gabo": percentage
percentage = count / len(txt.entities)
print(percentage)