Espagnol NER avec polyglotte
Vous allez poursuivre votre exploration de polyglot
avec des annotations en espagnol. Cet article n'est pas rédigé par un journal, il s'agit donc de votre premier exemple de texte plus proche d'un blog. Comment pensez-vous que cela puisse se comparer à la recherche d'entités ?
L'objet Text
a été créé en tant que txt
, et chaque entité a été imprimée, comme vous pouvez le voir dans le shell IPython.
Votre tâche spécifique consiste à déterminer combien d'entités contiennent les mots "Márquez"
ou "Gabo"
, qui désignent la même personne de manière différente !
Cet exercice fait partie du cours
Introduction au traitement du langage naturel en Python
Instructions
- Interrogez toutes les entités de
txt
en utilisantent
comme variable d'itération. - Vérifiez si l'entité contient
"Márquez"
ou"Gabo"
. Si c'est le cas, incrémentezcount
. N'oubliez pas d'inclure leá
accentué dans"Márquez"
! - Cliquez sur "Soumettre la réponse" pour voir quel pourcentage d'entités se réfère à Gabriel García Márquez (alias Gabo).
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Initialize the count variable: count
count = 0
# Iterate over all the entities
____
# Check whether the entity contains 'Márquez' or 'Gabo'
____
# Increment count
____
# Print count
print(count)
# Calculate the percentage of entities that refer to "Gabo": percentage
percentage = count / len(txt.entities)
print(percentage)