NER en español con polyglot
Vas a seguir explorando polyglot ahora con anotación en español. Este artículo no está escrito por un periódico, así que es tu primer ejemplo de un texto más tipo blog. ¿Cómo crees que afectará eso a la hora de encontrar entidades?
El objeto Text se ha creado como txt, y cada entidad se ha impreso, como puedes ver en la IPython Shell.
Tu tarea concreta es determinar cuántas entidades contienen las palabras "Márquez" o "Gabo". ¡Se refieren a la misma persona de distintas formas!
Este ejercicio forma parte del curso
Introducción al Natural Language Processing en Python
Instrucciones del ejercicio
- Itera sobre todas las entidades de
txt, usandoentcomo variable iteradora. - Comprueba si la entidad contiene
"Márquez"o"Gabo". Si es así, incrementacount. ¡No olvides incluir laácon tilde en"Márquez"! - Pulsa "Enviar respuesta" para ver qué porcentaje de entidades se refieren a Gabriel García Márquez (alias Gabo).
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Initialize the count variable: count
count = 0
# Iterate over all the entities
____
# Check whether the entity contains 'Márquez' or 'Gabo'
____
# Increment count
____
# Print count
print(count)
# Calculate the percentage of entities that refer to "Gabo": percentage
percentage = count / len(txt.entities)
print(percentage)