Español NER con políglota
Ahora continuarás tu exploración de polyglot
con algunas anotaciones en español. Este artículo no está escrito por un periódico, así que es tu primer ejemplo de un texto más parecido a un blog. ¿Cómo crees que podría compararse eso a la hora de encontrar entidades?
El objeto Text
se ha creado como txt
, y se ha impreso cada entidad, como puedes ver en la Shell ython IP.
Tu tarea específica consiste en determinar cuántas de las entidades contienen las palabras "Márquez"
o "Gabo"
: ¡se refieren a la misma persona de formas diferentes!
Este ejercicio forma parte del curso
Introducción al procesamiento de lenguaje natural en Python
Instrucciones de ejercicio
- Iterar sobre todas las entidades de
txt
, utilizandoent
como variable iteradora. - Comprueba si la entidad contiene
"Márquez"
o"Gabo"
. Si es así, incrementacount
. ¡No olvides incluir el acentoá
en"Márquez"
! - Pulsa "Enviar respuesta" para ver qué porcentaje de entidades se refieren a Gabriel García Márquez (alias Gabo).
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Initialize the count variable: count
count = 0
# Iterate over all the entities
____
# Check whether the entity contains 'Márquez' or 'Gabo'
____
# Increment count
____
# Print count
print(count)
# Calculate the percentage of entities that refer to "Gabo": percentage
percentage = count / len(txt.entities)
print(percentage)