ComenzarEmpieza gratis

Reconocimiento de entidades con spaCy

Las entidades con nombre son objetos del mundo real que tienen nombre, como ciudades, personas, fechas u horas. Podemos usar spaCy para encontrar entidades con nombre en nuestro texto transcrito.

En este ejercicio, transcribirás call_4_channel_2.wav (file) usando transcribe_audio() y luego usarás el modelo de lenguaje de spaCy, en_core_web_sm, para convertir el texto transcrito en un doc de spaCy.

Transformar el texto en un doc de spaCy nos permite aprovechar las funciones integradas de spaCy para analizar texto, como .text para los tokens (palabras sueltas), .sents para las oraciones y .ents para las entidades con nombre.

Este ejercicio forma parte del curso

Procesamiento del lenguaje hablado en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

import spacy

# Transcribe call 4 channel 2
call_4_channel_2_text = transcribe_audio("call_4_channel_2.wav")

# Create a spaCy language model instance
nlp = spacy.load("en_core_web_sm")

# Create a spaCy doc with call 4 channel 2 text
doc = nlp(____)

# Check the type of doc
print(type(___))
Editar y ejecutar código