BaşlayınÜcretsiz Başlayın

spaCy ile adlandırılmış varlık tanıma

Adlandırılmış varlıklar; şehirler, kişiler, tarihler veya saatler gibi, gerçek dünyadaki isimleri olan nesnelerdir. Transkribe edilmiş metnimizde adlandırılmış varlıkları bulmak için spaCy kullanabiliriz.

Bu egzersizde transcribe_audio() ile call_4_channel_2.wav (dosya) dosyasını metne dönüştüreceksin ve ardından transkribe edilen metni spaCy dil modeli en_core_web_sm ile bir spaCy doc nesnesine çevireceksin.

Metni bir spaCy doc’a dönüştürmek, metni analiz etmek için spaCy’nin yerleşik özelliklerinden yararlanmamı sağlar: örneğin, belirteçler (tekil sözcükler) için .text, cümleler için .sents ve adlandırılmış varlıklar için .ents.

Bu egzersiz

Python ile Konuşma Dili İşleme

kursunun bir parçasıdır
Kursu Görüntüle

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

import spacy

# Transcribe call 4 channel 2
call_4_channel_2_text = transcribe_audio("call_4_channel_2.wav")

# Create a spaCy language model instance
nlp = spacy.load("en_core_web_sm")

# Create a spaCy doc with call 4 channel 2 text
doc = nlp(____)

# Check the type of doc
print(type(___))
Kodu Düzenle ve Çalıştır