BaşlayınÜcretsiz Başlayın

spaCy ile NER

Named entity recognition (NER), bir belgedeki kişi ve yer adları gibi kilit öğeleri kolayca belirlemene yardımcı olur. Yapılandırılmamış verileri düzenlemeyi ve önemli bilgileri tespit etmeyi sağlar; bu da büyük veri kümeleriyle çalışıyorsan kritiktir. Bu egzersizde Named Entity Recognition pratiği yapacaksın.

en_core_web_sm, nlp olarak yüklendi. Airline Travel Information System (ATIS) veri kümesinden üç yorum texts adlı bir listede sana sunuldu.

Bu egzersiz

spaCy ile Natural Language Processing

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Liste kavraması kullanarak texts içindeki her metin için Doc kapsayıcılarından oluşan documents listesini oluştur.
  • Her doc kapsayıcısı için, doc.ents üzerinde yineleyerek her varlığın metnini ve karşılık gelen etiketini yazdır.
  • İkinci Doc kapsayıcısının altıncı belirtecinin (token) metnini ve varlık türünü yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Compile a list of all Doc containers of texts
documents = [____ for text in texts]

# Print the entity text and label for the entities in each document
for doc in documents:
    print([(____, ____) for ent in ____])
    
# Print the 6th token's text and entity type of the second document
print("\nText:", documents[1][5].____, "| Entity type: ", documents[1][5].____)
Kodu Düzenle ve Çalıştır