NER in spagnolo con polyglot

Continuerai a esplorare polyglot con un po' di annotazione in spagnolo. Questo articolo non è scritto da un giornale, quindi è il tuo primo esempio di un testo più simile a un blog. Secondo te, come influisce questo nel trovare le entità?

L'oggetto Text è stato creato come txt e ogni entità è stata stampata, come puoi vedere nell'IPython Shell.

Il tuo compito è determinare quante entità contengono le parole "Márquez" o "Gabo" — si riferiscono alla stessa persona in modi diversi!

Questo esercizio fa parte del corso

Introduzione al Natural Language Processing in Python

Visualizza corso

Istruzioni dell'esercizio

Itera su tutte le entità di txt, usando ent come variabile iteratore.
Verifica se l'entità contiene "Márquez" o "Gabo". Se sì, incrementa count. Non dimenticare l'accento á in "Márquez"!
Premi "Invia risposta" per vedere quale percentuale di entità si riferisce a Gabriel García Márquez (alias Gabo).

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Initialize the count variable: count
count = 0

# Iterate over all the entities
____
    # Check whether the entity contains 'Márquez' or 'Gabo'
    ____
        # Increment count
        ____

# Print count
print(count)

# Calculate the percentage of entities that refer to "Gabo": percentage
percentage = count / len(txt.entities)
print(percentage)

Modifica ed esegui il codice