MulaiMulai sekarang secara gratis

Kemiripan semantik untuk mengategorikan teks

Tujuan utama kemiripan semantik adalah mengukur jarak antara makna semantik dari sepasang kata, frasa, kalimat, atau dokumen. Sebagai contoh, kata “car” lebih mirip dengan “bus” dibandingkan dengan “cat”. Pada latihan ini, Anda akan menemukan kalimat-kalimat yang mirip dengan kata sauce dari teks contoh di Amazon Fine Food Reviews. Anda dapat menggunakan spacy untuk menghitung skor kemiripan antara kata sauce dan setiap kalimat dalam string texts, lalu melaporkan skor dari kalimat yang paling mirip.

Sebuah string texts telah dimuat sebelumnya yang berisi semua data Text dari ulasan. Anda akan menggunakan model bahasa Inggris en_core_web_md untuk latihan ini yang sudah tersedia sebagai nlp.

Latihan ini adalah bagian dari kursus

Pemrosesan Bahasa Alami dengan spaCy

Lihat Kursus

Petunjuk latihan

  • Gunakan nlp untuk menghasilkan kontainer Doc untuk kata sauce dan untuk texts, lalu simpan masing-masing pada key dan sentences.
  • Hitung skor kemiripan antara kata sauce dan setiap kalimat dalam string texts (dibulatkan hingga dua digit).

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Populate Doc containers for the word "sauce" and for "texts" string
key = ____
sentences = ____

# Calculate similarity score of each sentence and a Doc container for the word sauce
semantic_scores = []
for sent in sentences.____:
	semantic_scores.append({"score": round(sent.____(____), 2)})
print(semantic_scores)
Edit dan Jalankan Kode