MulaiMulai sekarang secara gratis

Kemiripan Span dengan spaCy

Menentukan kemiripan semantik dapat membantu Anda mengategorikan teks ke dalam kategori yang telah ditentukan, mendeteksi teks yang relevan, atau menandai konten duplikat. Pada latihan ini, Anda akan berlatih menghitung kemiripan semantik dari span suatu dokumen terhadap sebuah dokumen acuan. Tujuannya adalah menemukan Span tiga token yang paling relevan dengan canned dog food.

Kategori canned dog food yang diberikan disimpan pada category. Sebuah string teks sudah disimpan dalam objek text dan en_core_web_md telah dimuat sebagai nlp. Wadah Doc dari text juga sudah dibuat dan disimpan pada document.

Latihan ini adalah bagian dari kursus

Pemrosesan Bahasa Alami dengan spaCy

Lihat Kursus

Petunjuk latihan

  • Buat wadah Doc untuk category dan simpan pada category_document.
  • Cetak skor kemiripan antara Span yang diberikan dan category_document, dibulatkan hingga tiga digit.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a Doc container for the category
category = "canned dog food"
category_document = nlp(____)

# Print similarity score of a given Span and category_document
document_span = document[0:3]
print(f"Semantic similarity with", document_span.text, ":", round(document_span.____(____), 3))
Edit dan Jalankan Kode