MulaiMulai sekarang secara gratis

Mengukur kemiripan vektor kata

Pada pelajaran ini, Anda akan memahami kekuatan vektor kata menggunakan vektor kata yang dilatih di dunia nyata. Vektor kata ini diekstrak dari daftar vektor kata yang dipublikasikan oleh Stanford NLP group. Vektor kata adalah sebuah urutan atau vektor berisi nilai numerik. Sebagai contoh, dog = (0.31, 0.92, 0.13)

Jarak antar vektor kata dapat diukur menggunakan metrik kemiripan berpasangan. Di sini kita akan menggunakan sklearn.metrics.pairwise.cosine_similarity. Cosine similarity menghasilkan nilai yang lebih tinggi ketika kemiripan per unsur dari dua vektor tinggi, dan sebaliknya.

Latihan ini adalah bagian dari kursus

Penerjemahan Mesin dengan Keras

Lihat Kursus

Petunjuk latihan

  • Cetak panjang cat_vector menggunakan atribut ndarray.size.
  • Hitung dan cetak kemiripan antara cat_vector dan window_vector menggunakan cosine_similarity.
  • Hitung dan cetak kemiripan antara cat_vector dan dog_vector menggunakan cosine_similarity.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

from sklearn.metrics.pairwise import cosine_similarity

# Print the length of the cat_vector
print('Length of the cat_vector: ', ____.____)

# Compute and print the similarity between cat and window vectors
dist_cat_window = ____(____, window_vector)
print('Similarity(cat, window): ', ____)

# Compute and print the similarity between cat and dog vectors
print('Similarity(cat,dog): ', ____(____, ____))
Edit dan Jalankan Kode