Vektorisasi teks
Sekarang Anda akan mengubah kolom desc dalam himpunan data UFO menjadi vektor tf/idf, karena kemungkinan ada sesuatu yang dapat kita pelajari dari bidang ini.
Latihan ini adalah bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Petunjuk latihan
- Cetak
.head()dari kolomdesc. - Instansiasi objek
TfidfVectorizer(). - Fit dan transformasikan kolom
descmenggunakanvec. - Cetak
.shapedari vektordesc_tfidfuntuk melihat jumlah kolom yang dihasilkan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Take a look at the head of the desc field
print(____)
# Instantiate the tfidf vectorizer object
vec = ____
# Fit and transform desc using vec
desc_tfidf = vec.____
# Look at the number of columns and rows
print(____.shape)