Pengenalan entitas bernama di spaCy
Entitas bernama adalah objek dunia nyata yang memiliki nama, seperti kota, orang, tanggal, atau waktu. Kita dapat menggunakan spaCy untuk menemukan entitas bernama dalam teks yang ditranskripsi.
Dalam latihan ini, Anda akan mentranskripsikan call_4_channel_2.wav (file) menggunakan transcribe_audio() lalu menggunakan model bahasa spaCy, en_core_web_sm, untuk mengonversi teks transkripsi menjadi dokumen spaCy.
Mengubah teks menjadi dokumen spaCy memungkinkan kita memanfaatkan fitur bawaan spaCy untuk menganalisis teks, misalnya .text untuk token (kata tunggal), .sents untuk kalimat, dan .ents untuk entitas bernama.
Latihan ini adalah bagian dari kursus
Pemrosesan Bahasa Lisan dengan Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
import spacy
# Transcribe call 4 channel 2
call_4_channel_2_text = transcribe_audio("call_4_channel_2.wav")
# Create a spaCy language model instance
nlp = spacy.load("en_core_web_sm")
# Create a spaCy doc with call 4 channel 2 text
doc = nlp(____)
# Check the type of doc
print(type(___))