Aan de slagGa gratis aan de slag

Herkenning van naamwoorden (NER) in spaCy

Naamgedefinieerde entiteiten zijn echte objecten met een naam, zoals steden, personen, datums of tijden. We kunnen spaCy gebruiken om naamgedefinieerde entiteiten in onze getranscribeerde tekst te vinden.

In deze oefening transcribeer je call_4_channel_2.wav (bestand) met transcribe_audio() en gebruik je daarna het taalmodel van spaCy, en_core_web_sm, om de getranscribeerde tekst om te zetten naar een spaCy-doc.

Tekst omzetten naar een spaCy-doc laat ons spaCy’s ingebouwde functies voor tekstanalyse benutten, zoals .text voor tokens (losse woorden), .sents voor zinnen en .ents voor naamgedefinieerde entiteiten.

Deze oefening maakt deel uit van de cursus

Spoken Language Processing in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

import spacy

# Transcribe call 4 channel 2
call_4_channel_2_text = transcribe_audio("call_4_channel_2.wav")

# Create a spaCy language model instance
nlp = spacy.load("en_core_web_sm")

# Create a spaCy doc with call 4 channel 2 text
doc = nlp(____)

# Check the type of doc
print(type(___))
Code bewerken en uitvoeren