Membuat vektorisasi teks
Sekarang Anda akan mengubah kolom title dari himpunan data volunteer menjadi vektor teks, yang akan Anda gunakan dalam tugas prediksi pada latihan berikutnya.
Latihan ini adalah bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Petunjuk latihan
- Simpan kolom
volunteer["title"]ke dalam variabel bernamatitle_text. - Instansiasi
TfidfVectorizersebagaitfidf_vec. - Ubah teks di
title_textmenjadi vektor tf-idf menggunakantfidf_vec.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Take the title text
title_text = ____
# Create the vectorizer method
tfidf_vec = ____
# Transform the text into tf-idf vectors
text_tfidf = tfidf_vec.____(____)