Español NER con políglota

Ahora continuarás tu exploración de polyglot con algunas anotaciones en español. Este artículo no está escrito por un periódico, así que es tu primer ejemplo de un texto más parecido a un blog. ¿Cómo crees que podría compararse eso a la hora de encontrar entidades?

El objeto Text se ha creado como txt, y se ha impreso cada entidad, como puedes ver en la Shell ython IP.

Tu tarea específica consiste en determinar cuántas de las entidades contienen las palabras "Márquez" o "Gabo": ¡se refieren a la misma persona de formas diferentes!

Este ejercicio forma parte del curso

Introducción al procesamiento de lenguaje natural en Python

Ver curso

Instrucciones de ejercicio

  • Iterar sobre todas las entidades de txt, utilizando ent como variable iteradora.
  • Comprueba si la entidad contiene "Márquez" o "Gabo". Si es así, incrementa count. ¡No olvides incluir el acento á en "Márquez"!
  • Pulsa "Enviar respuesta" para ver qué porcentaje de entidades se refieren a Gabriel García Márquez (alias Gabo).

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Initialize the count variable: count
count = 0

# Iterate over all the entities
____
    # Check whether the entity contains 'Márquez' or 'Gabo'
    ____
        # Increment count
        ____

# Print count
print(count)

# Calculate the percentage of entities that refer to "Gabo": percentage
percentage = count / len(txt.entities)
print(percentage)