Mengukur kemiripan vektor kata
Pada pelajaran ini, Anda akan memahami kekuatan vektor kata menggunakan vektor kata yang dilatih di dunia nyata. Vektor kata ini diekstrak dari daftar vektor kata yang dipublikasikan oleh Stanford NLP group. Vektor kata adalah sebuah urutan atau vektor berisi nilai numerik. Sebagai contoh,
dog = (0.31, 0.92, 0.13)
Jarak antar vektor kata dapat diukur menggunakan metrik kemiripan berpasangan. Di sini kita akan menggunakan sklearn.metrics.pairwise.cosine_similarity. Cosine similarity menghasilkan nilai yang lebih tinggi ketika kemiripan per unsur dari dua vektor tinggi, dan sebaliknya.
Latihan ini adalah bagian dari kursus
Penerjemahan Mesin dengan Keras
Petunjuk latihan
- Cetak panjang
cat_vectormenggunakan atributndarray.size. - Hitung dan cetak kemiripan antara
cat_vectordanwindow_vectormenggunakancosine_similarity. - Hitung dan cetak kemiripan antara
cat_vectordandog_vectormenggunakancosine_similarity.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
from sklearn.metrics.pairwise import cosine_similarity
# Print the length of the cat_vector
print('Length of the cat_vector: ', ____.____)
# Compute and print the similarity between cat and window vectors
dist_cat_window = ____(____, window_vector)
print('Similarity(cat, window): ', ____)
# Compute and print the similarity between cat and dog vectors
print('Similarity(cat,dog): ', ____(____, ____))