Vektorisasi teks
Sekarang Anda akan mengubah kolom desc dalam himpunan data UFO menjadi vektor tf/idf, karena kemungkinan ada sesuatu yang dapat kita pelajari dari bidang ini.
Latihan ini merupakan bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Instruksi latihan
- Cetak
.head()dari kolomdesc. - Instansiasi objek
TfidfVectorizer(). - Fit dan transformasikan kolom
descmenggunakanvec. - Cetak
.shapedari vektordesc_tfidfuntuk melihat jumlah kolom yang dihasilkan.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Take a look at the head of the desc field
print(____)
# Instantiate the tfidf vectorizer object
vec = ____
# Fit and transform desc using vec
desc_tfidf = vec.____
# Look at the number of columns and rows
print(____.shape)