CommencerCommencer gratuitement

Espagnol NER avec polyglotte

Vous allez poursuivre votre exploration de polyglot avec des annotations en espagnol. Cet article n'est pas rédigé par un journal, il s'agit donc de votre premier exemple de texte plus proche d'un blog. Comment pensez-vous que cela puisse se comparer à la recherche d'entités ?

L'objet Text a été créé en tant que txt, et chaque entité a été imprimée, comme vous pouvez le voir dans le shell IPython.

Votre tâche spécifique consiste à déterminer combien d'entités contiennent les mots "Márquez" ou "Gabo", qui désignent la même personne de manière différente !

Cet exercice fait partie du cours

Introduction au traitement du langage naturel en Python

Afficher le cours

Instructions

  • Interrogez toutes les entités de txt en utilisant ent comme variable d'itération.
  • Vérifiez si l'entité contient "Márquez" ou "Gabo". Si c'est le cas, incrémentez count. N'oubliez pas d'inclure le á accentué dans "Márquez"!
  • Cliquez sur "Soumettre la réponse" pour voir quel pourcentage d'entités se réfère à Gabriel García Márquez (alias Gabo).

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Initialize the count variable: count
count = 0

# Iterate over all the entities
____
    # Check whether the entity contains 'Márquez' or 'Gabo'
    ____
        # Increment count
        ____

# Print count
print(count)

# Calculate the percentage of entities that refer to "Gabo": percentage
percentage = count / len(txt.entities)
print(percentage)
Modifier et exécuter le code