Reconnaissance d’entités nommées avec spaCy
Les entités nommées sont des objets du monde réel qui portent un nom, comme des villes, des personnes, des dates ou des heures. Nous pouvons utiliser spaCy pour repérer les entités nommées dans notre texte transcrit.
Dans cet exercice, vous allez transcrire call_4_channel_2.wav (file) avec transcribe_audio() puis utiliser le modèle linguistique de spaCy, en_core_web_sm, pour convertir le texte transcrit en document spaCy.
Transformer un texte en document spaCy nous permet de tirer parti des fonctionnalités intégrées de spaCy pour analyser le texte : .text pour les tokens (mots isolés), .sents pour les phrases et .ents pour les entités nommées.
Cet exercice fait partie du cours
Traitement du langage parlé en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
import spacy
# Transcribe call 4 channel 2
call_4_channel_2_text = transcribe_audio("call_4_channel_2.wav")
# Create a spaCy language model instance
nlp = spacy.load("en_core_web_sm")
# Create a spaCy doc with call 4 channel 2 text
doc = nlp(____)
# Check the type of doc
print(type(___))