Kesamaan Doc dengan spaCy
Kemiripan semantik adalah proses menganalisis beberapa kalimat untuk mengidentifikasi kesamaan di antara kalimat-kalimat tersebut. Pada latihan ini, Anda akan berlatih menghitung kemiripan semantik dokumen terhadap sebuah dokumen acuan. Tujuannya adalah mengelompokkan daftar ulasan yang relevan dengan makanan anjing kalengan.
Kategori makanan anjing kalengan disimpan pada category. Contoh lima ulasan makanan telah disediakan untuk Anda dalam sebuah daftar bernama texts. en_core_web_md dimuat sebagai nlp.
Latihan ini merupakan bagian dari kursus
Pemrosesan Bahasa Alami dengan spaCy
Instruksi latihan
- Buat daftar
documentsyang berisi kontainerDocdari semuatexts. - Buat kontainer
Docdaricategorydan simpan sebagaicategory_document. - Lakukan iterasi melalui
documentsdan cetak skor kemiripan setiap kontainerDocdengancategory_document, dibulatkan hingga tiga digit.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create a documents list containing Doc containers
documents = [____ for t in texts]
# Create a Doc container of the category
category = "canned dog food"
category_document = ____(____)
# Print similarity scores of each Doc container and the category_document
for i, doc in enumerate(documents):
print(f"Semantic similarity with document {i+1}:", round(doc.____(____), 3))