Reconocimiento de entidades con spaCy
Las entidades con nombre son objetos del mundo real que tienen nombre, como ciudades, personas, fechas u horas. Podemos usar spaCy para encontrar entidades con nombre en nuestro texto transcrito.
En este ejercicio, transcribirás call_4_channel_2.wav (file) usando transcribe_audio() y luego usarás el modelo de lenguaje de spaCy, en_core_web_sm, para convertir el texto transcrito en un doc de spaCy.
Transformar el texto en un doc de spaCy nos permite aprovechar las funciones integradas de spaCy para analizar texto, como .text para los tokens (palabras sueltas), .sents para las oraciones y .ents para las entidades con nombre.
Este ejercicio forma parte del curso
Procesamiento del lenguaje hablado en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
import spacy
# Transcribe call 4 channel 2
call_4_channel_2_text = transcribe_audio("call_4_channel_2.wav")
# Create a spaCy language model instance
nlp = spacy.load("en_core_web_sm")
# Create a spaCy doc with call 4 channel 2 text
doc = nlp(____)
# Check the type of doc
print(type(___))