Bagian 2: Menjelajahi fungsi to_categorical()

Pada bagian 1, Anda telah mengimplementasikan fungsi compute_onehot_length() yang tidak menggunakan argumen num_classes saat menghitung vektor one-hot.

Argumen num_classes mengendalikan panjang vektor one-hot yang dihasilkan oleh fungsi to_categorical(). Anda akan melihat bahwa dalam situasi ketika Anda memiliki dua korpus berbeda (yaitu kumpulan teks) dengan kosakata yang berbeda, membiarkan num_classes tidak ditentukan dapat menghasilkan vektor one-hot dengan panjang yang bervariasi.

Untuk latihan ini, fungsi compute_onehot_length() dan kamus word2index telah disediakan.

Latihan ini merupakan bagian dari kursus

Penerjemahan Mesin dengan Keras

Lihat Kursus

Instruksi latihan

Panggil compute_onehot_length() pada words_1.
Panggil compute_onehot_length() pada words_2.
Cetak panjang vektor one-hot yang diperoleh untuk words_1 dan words_2.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

words_1 = ["I", "like", "cats", "We", "like", "dogs", "He", "hates", "rabbits"]
# Call compute_onehot_length on words_1
length_1 = ____(____, ____)

words_2 = ["I", "like", "cats", "We", "like", "dogs", "We", "like", "cats"]
# Call compute_onehot_length on words_2
length_2 = ____(____, ____)

# Print length_1 and length_2
print("length_1 =>", ____, " and length_2 => ", ____)

Edit dan Jalankan Kode