Bagian 1: Mengeksplorasi fungsi to_categorical()
Tahukah Anda bahwa pada permasalahan dunia nyata, ukuran kosakata dapat menjadi sangat besar (misalnya lebih dari ratusan ribu)?
Latihan ini dibagi menjadi dua bagian dan Anda akan mempelajari pentingnya menetapkan argumen num_classes pada fungsi to_categorical(). Pada bagian 1, Anda akan mengimplementasikan fungsi compute_onehot_length() yang menghasilkan vektor one-hot untuk daftar kata tertentu dan menghitung panjang vektor tersebut.
Fungsi to_categorical() sudah diimpor.
Latihan ini adalah bagian dari kursus
Penerjemahan Mesin dengan Keras
Petunjuk latihan
- Buat ID kata dengan menggunakan
wordsdanword2indexdalamcompute_onehot_length(). - Buat vektor one-hot menggunakan fungsi
to_categorical()dengan ID kata. - Kembalikan panjang satu vektor one-hot menggunakan sintaks
<array>.shape. - Hitung dan cetak panjang vektor one-hot menggunakan
compute_onehot_length()untuk daftar kataHe,drank,milk.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
def compute_onehot_length(words, word2index):
# Create word IDs for words
word_ids = [____[w] for w in ____]
# Convert word IDs to onehot vectors
onehot = ____(____)
# Return the length of a single one-hot vector
return onehot.____[1]
word2index = {"He":0, "drank": 1, "milk": 2}
# Compute and print onehot length of a list of words
print(____([____,____,____], ____))