Mulai sekarangMulai gratis

Mengukur kemiripan vektor kata

Pada pelajaran ini, Anda akan memahami kekuatan vektor kata menggunakan vektor kata yang dilatih di dunia nyata. Vektor kata ini diekstrak dari daftar vektor kata yang dipublikasikan oleh Stanford NLP group. Vektor kata adalah sebuah urutan atau vektor berisi nilai numerik. Sebagai contoh, dog = (0.31, 0.92, 0.13)

Jarak antar vektor kata dapat diukur menggunakan metrik kemiripan berpasangan. Di sini kita akan menggunakan sklearn.metrics.pairwise.cosine_similarity. Cosine similarity menghasilkan nilai yang lebih tinggi ketika kemiripan per unsur dari dua vektor tinggi, dan sebaliknya.

Latihan ini merupakan bagian dari kursus

Penerjemahan Mesin dengan Keras

Lihat Kursus

Instruksi latihan

  • Cetak panjang cat_vector menggunakan atribut ndarray.size.
  • Hitung dan cetak kemiripan antara cat_vector dan window_vector menggunakan cosine_similarity.
  • Hitung dan cetak kemiripan antara cat_vector dan dog_vector menggunakan cosine_similarity.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

from sklearn.metrics.pairwise import cosine_similarity

# Print the length of the cat_vector
print('Length of the cat_vector: ', ____.____)

# Compute and print the similarity between cat and window vectors
dist_cat_window = ____(____, window_vector)
print('Similarity(cat, window): ', ____)

# Compute and print the similarity between cat and dog vectors
print('Similarity(cat,dog): ', ____(____, ____))
Edit dan Jalankan Kode