MulaiMulai sekarang secara gratis

Kesamaan Doc dengan spaCy

Kemiripan semantik adalah proses menganalisis beberapa kalimat untuk mengidentifikasi kesamaan di antara kalimat-kalimat tersebut. Pada latihan ini, Anda akan berlatih menghitung kemiripan semantik dokumen terhadap sebuah dokumen acuan. Tujuannya adalah mengelompokkan daftar ulasan yang relevan dengan makanan anjing kalengan.

Kategori makanan anjing kalengan disimpan pada category. Contoh lima ulasan makanan telah disediakan untuk Anda dalam sebuah daftar bernama texts. en_core_web_md dimuat sebagai nlp.

Latihan ini adalah bagian dari kursus

Pemrosesan Bahasa Alami dengan spaCy

Lihat Kursus

Petunjuk latihan

  • Buat daftar documents yang berisi kontainer Doc dari semua texts.
  • Buat kontainer Doc dari category dan simpan sebagai category_document.
  • Lakukan iterasi melalui documents dan cetak skor kemiripan setiap kontainer Doc dengan category_document, dibulatkan hingga tiga digit.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a documents list containing Doc containers
documents = [____ for t in texts]

# Create a Doc container of the category
category = "canned dog food"
category_document = ____(____)

# Print similarity scores of each Doc container and the category_document
for i, doc in enumerate(documents):
  print(f"Semantic similarity with document {i+1}:", round(doc.____(____), 3))
Edit dan Jalankan Kode