Bagian 2: Menjelajahi fungsi to_categorical()
Pada bagian 1, Anda telah mengimplementasikan fungsi compute_onehot_length() yang tidak menggunakan argumen num_classes saat menghitung vektor one-hot.
Argumen num_classes mengendalikan panjang vektor one-hot yang dihasilkan oleh fungsi to_categorical(). Anda akan melihat bahwa dalam situasi ketika Anda memiliki dua korpus berbeda (yaitu kumpulan teks) dengan kosakata yang berbeda, membiarkan num_classes tidak ditentukan dapat menghasilkan vektor one-hot dengan panjang yang bervariasi.
Untuk latihan ini, fungsi compute_onehot_length() dan kamus word2index telah disediakan.
Latihan ini adalah bagian dari kursus
Penerjemahan Mesin dengan Keras
Petunjuk latihan
- Panggil
compute_onehot_length()padawords_1. - Panggil
compute_onehot_length()padawords_2. - Cetak panjang vektor one-hot yang diperoleh untuk
words_1danwords_2.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
words_1 = ["I", "like", "cats", "We", "like", "dogs", "He", "hates", "rabbits"]
# Call compute_onehot_length on words_1
length_1 = ____(____, ____)
words_2 = ["I", "like", "cats", "We", "like", "dogs", "We", "like", "cats"]
# Call compute_onehot_length on words_2
length_2 = ____(____, ____)
# Print length_1 and length_2
print("length_1 =>", ____, " and length_2 => ", ____)