MulaiMulai sekarang secara gratis

Vektorisasi teks

Sekarang Anda akan mengubah kolom desc dalam himpunan data UFO menjadi vektor tf/idf, karena kemungkinan ada sesuatu yang dapat kita pelajari dari bidang ini.

Latihan ini adalah bagian dari kursus

Prapemrosesan untuk Machine Learning di Python

Lihat Kursus

Petunjuk latihan

  • Cetak .head() dari kolom desc.
  • Instansiasi objek TfidfVectorizer().
  • Fit dan transformasikan kolom desc menggunakan vec.
  • Cetak .shape dari vektor desc_tfidf untuk melihat jumlah kolom yang dihasilkan.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Take a look at the head of the desc field
print(____)

# Instantiate the tfidf vectorizer object
vec = ____

# Fit and transform desc using vec
desc_tfidf = vec.____

# Look at the number of columns and rows
print(____.shape)
Edit dan Jalankan Kode