Mengukur kemiripan vektor kata
Pada pelajaran ini, Anda akan memahami kekuatan vektor kata menggunakan vektor kata yang dilatih di dunia nyata. Vektor kata ini diekstrak dari daftar vektor kata yang dipublikasikan oleh Stanford NLP group. Vektor kata adalah sebuah urutan atau vektor berisi nilai numerik. Sebagai contoh,
dog = (0.31, 0.92, 0.13)
Jarak antar vektor kata dapat diukur menggunakan metrik kemiripan berpasangan. Di sini kita akan menggunakan sklearn.metrics.pairwise.cosine_similarity. Cosine similarity menghasilkan nilai yang lebih tinggi ketika kemiripan per unsur dari dua vektor tinggi, dan sebaliknya.
Latihan ini merupakan bagian dari kursus
Penerjemahan Mesin dengan Keras
Instruksi latihan
- Cetak panjang
cat_vectormenggunakan atributndarray.size. - Hitung dan cetak kemiripan antara
cat_vectordanwindow_vectormenggunakancosine_similarity. - Hitung dan cetak kemiripan antara
cat_vectordandog_vectormenggunakancosine_similarity.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
from sklearn.metrics.pairwise import cosine_similarity
# Print the length of the cat_vector
print('Length of the cat_vector: ', ____.____)
# Compute and print the similarity between cat and window vectors
dist_cat_window = ____(____, window_vector)
print('Similarity(cat, window): ', ____)
# Compute and print the similarity between cat and dog vectors
print('Similarity(cat,dog): ', ____(____, ____))