ComenzarEmpieza gratis

NER en español con polyglot

Vas a seguir explorando polyglot ahora con anotación en español. Este artículo no está escrito por un periódico, así que es tu primer ejemplo de un texto más tipo blog. ¿Cómo crees que afectará eso a la hora de encontrar entidades?

El objeto Text se ha creado como txt, y cada entidad se ha impreso, como puedes ver en la IPython Shell.

Tu tarea concreta es determinar cuántas entidades contienen las palabras "Márquez" o "Gabo". ¡Se refieren a la misma persona de distintas formas!

Este ejercicio forma parte del curso

Introducción al Natural Language Processing en Python

Ver curso

Instrucciones del ejercicio

  • Itera sobre todas las entidades de txt, usando ent como variable iteradora.
  • Comprueba si la entidad contiene "Márquez" o "Gabo". Si es así, incrementa count. ¡No olvides incluir la á con tilde en "Márquez"!
  • Pulsa "Enviar respuesta" para ver qué porcentaje de entidades se refieren a Gabriel García Márquez (alias Gabo).

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Initialize the count variable: count
count = 0

# Iterate over all the entities
____
    # Check whether the entity contains 'Márquez' or 'Gabo'
    ____
        # Increment count
        ____

# Print count
print(count)

# Calculate the percentage of entities that refer to "Gabo": percentage
percentage = count / len(txt.entities)
print(percentage)
Editar y ejecutar código