Keras ile cümleleri tokenleştirme

Burada Keras Tokenizer ile bizzat çalışacaksın. Keras Tokenizer, birkaç satır kodla kritik metin işleme adımlarını yapmana yardım eden harika bir araçtır. Örneğin, Keras Tokenizer tek bir fonksiyon çağrısıyla sözlüğündeki kelimeleri otomatik olarak ID’lere eşler. Burada bunu daha ayrıntılı öğreneceksin.

Bir Keras Tokenizer nesnesi oluşturup onu bazı metinler üzerinde eğiteceksin; böylece Tokenizer, kelimelerden ve bunlara karşılık gelen ID’lerden oluşan bir sözlük kurabilecek. Tokenizer’ı eğitmek için kullanılan metinler Udacity Github Repo kaynağından alınmıştır.

Bu egzersiz, kursun bir parçasıdır

Keras ile Machine Translation

Kursa Göz Atın

Egzersiz talimatları

Bir Keras Tokenizer nesnesi tanımla.
Tokenizer'ı en_text üzerinde uygula (fit et).
Verilen ["january", "apples", "summer"] listesinde her w kelimesi için kelime ID’sini al.
Kelimeyi ve buna karşılık gelen ID’yi yazdır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

from tensorflow.keras.preprocessing.text import Tokenizer

# Define a Keras Tokenizer
en_tok = ____

# Fit the tokenizer on some text
en_tok.____(____)

for w in ["january", "apples", "summer"]:
  # Get the word ID of word w
  id = en_tok.____[____]
  # Print the word and the word ID
  print(____, " has id: ", _____)

Kodu Düzenle ve Çalıştır