Mulai sekarangMulai gratis

Kesamaan Doc dengan spaCy

Kemiripan semantik adalah proses menganalisis beberapa kalimat untuk mengidentifikasi kesamaan di antara kalimat-kalimat tersebut. Pada latihan ini, Anda akan berlatih menghitung kemiripan semantik dokumen terhadap sebuah dokumen acuan. Tujuannya adalah mengelompokkan daftar ulasan yang relevan dengan makanan anjing kalengan.

Kategori makanan anjing kalengan disimpan pada category. Contoh lima ulasan makanan telah disediakan untuk Anda dalam sebuah daftar bernama texts. en_core_web_md dimuat sebagai nlp.

Latihan ini merupakan bagian dari kursus

Pemrosesan Bahasa Alami dengan spaCy

Lihat Kursus

Instruksi latihan

  • Buat daftar documents yang berisi kontainer Doc dari semua texts.
  • Buat kontainer Doc dari category dan simpan sebagai category_document.
  • Lakukan iterasi melalui documents dan cetak skor kemiripan setiap kontainer Doc dengan category_document, dibulatkan hingga tiga digit.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Create a documents list containing Doc containers
documents = [____ for t in texts]

# Create a Doc container of the category
category = "canned dog food"
category_document = ____(____)

# Print similarity scores of each Doc container and the category_document
for i, doc in enumerate(documents):
  print(f"Semantic similarity with document {i+1}:", round(doc.____(____), 3))
Edit dan Jalankan Kode