IniziaInizia gratis

NER in spagnolo con polyglot

Continuerai a esplorare polyglot con un po' di annotazione in spagnolo. Questo articolo non è scritto da un giornale, quindi è il tuo primo esempio di un testo più simile a un blog. Secondo te, come influisce questo nel trovare le entità?

L'oggetto Text è stato creato come txt e ogni entità è stata stampata, come puoi vedere nell'IPython Shell.

Il tuo compito è determinare quante entità contengono le parole "Márquez" o "Gabo" — si riferiscono alla stessa persona in modi diversi!

Questo esercizio fa parte del corso

Introduzione al Natural Language Processing in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Itera su tutte le entità di txt, usando ent come variabile iteratore.
  • Verifica se l'entità contiene "Márquez" o "Gabo". Se sì, incrementa count. Non dimenticare l'accento á in "Márquez"!
  • Premi "Invia risposta" per vedere quale percentuale di entità si riferisce a Gabriel García Márquez (alias Gabo).

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Initialize the count variable: count
count = 0

# Iterate over all the entities
____
    # Check whether the entity contains 'Márquez' or 'Gabo'
    ____
        # Increment count
        ____

# Print count
print(count)

# Calculate the percentage of entities that refer to "Gabo": percentage
percentage = count / len(txt.entities)
print(percentage)
Modifica ed esegui il codice