Membuat vektorisasi teks
Sekarang Anda akan mengubah kolom title dari himpunan data volunteer menjadi vektor teks, yang akan Anda gunakan dalam tugas prediksi pada latihan berikutnya.
Latihan ini merupakan bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Instruksi latihan
- Simpan kolom
volunteer["title"]ke dalam variabel bernamatitle_text. - Instansiasi
TfidfVectorizersebagaitfidf_vec. - Ubah teks di
title_textmenjadi vektor tf-idf menggunakantfidf_vec.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Take the title text
title_text = ____
# Create the vectorizer method
tfidf_vec = ____
# Transform the text into tf-idf vectors
text_tfidf = tfidf_vec.____(____)