Kesamaan Doc dengan spaCy
Kemiripan semantik adalah proses menganalisis beberapa kalimat untuk mengidentifikasi kesamaan di antara kalimat-kalimat tersebut. Pada latihan ini, Anda akan berlatih menghitung kemiripan semantik dokumen terhadap sebuah dokumen acuan. Tujuannya adalah mengelompokkan daftar ulasan yang relevan dengan makanan anjing kalengan.
Kategori makanan anjing kalengan disimpan pada category. Contoh lima ulasan makanan telah disediakan untuk Anda dalam sebuah daftar bernama texts. en_core_web_md dimuat sebagai nlp.
Latihan ini adalah bagian dari kursus
Pemrosesan Bahasa Alami dengan spaCy
Petunjuk latihan
- Buat daftar
documentsyang berisi kontainerDocdari semuatexts. - Buat kontainer
Docdaricategorydan simpan sebagaicategory_document. - Lakukan iterasi melalui
documentsdan cetak skor kemiripan setiap kontainerDocdengancategory_document, dibulatkan hingga tiga digit.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a documents list containing Doc containers
documents = [____ for t in texts]
# Create a Doc container of the category
category = "canned dog food"
category_document = ____(____)
# Print similarity scores of each Doc container and the category_document
for i, doc in enumerate(documents):
print(f"Semantic similarity with document {i+1}:", round(doc.____(____), 3))