spaCy ile NER
Named entity recognition (NER), bir belgedeki kişi ve yer adları gibi kilit öğeleri kolayca belirlemene yardımcı olur. Yapılandırılmamış verileri düzenlemeyi ve önemli bilgileri tespit etmeyi sağlar; bu da büyük veri kümeleriyle çalışıyorsan kritiktir. Bu egzersizde Named Entity Recognition pratiği yapacaksın.
en_core_web_sm, nlp olarak yüklendi. Airline Travel Information System (ATIS) veri kümesinden üç yorum texts adlı bir listede sana sunuldu.
Bu egzersiz
spaCy ile Natural Language Processing
kursunun bir parçasıdırEgzersiz talimatları
- Liste kavraması kullanarak
textsiçindeki her metin içinDockapsayıcılarından oluşandocumentslistesini oluştur. - Her
dockapsayıcısı için,doc.entsüzerinde yineleyerek her varlığın metnini ve karşılık gelen etiketini yazdır. - İkinci
Dockapsayıcısının altıncı belirtecinin (token) metnini ve varlık türünü yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Compile a list of all Doc containers of texts
documents = [____ for text in texts]
# Print the entity text and label for the entities in each document
for doc in documents:
print([(____, ____) for ent in ____])
# Print the 6th token's text and entity type of the second document
print("\nText:", documents[1][5].____, "| Entity type: ", documents[1][5].____)