MulaiMulai sekarang secara gratis

TfIdf pertama Anda

Dalam latihan ini, Anda akan menerapkan metode TfIdf pada himpunan data kecil annak, yang memuat kalimat pertama dari Anna Karenina karya Leo Tolstoy.

Tugas Anda adalah bekerja dengan himpunan data ini dan menerapkan fungsi TfidfVectorizer(). Ingat bahwa melakukan transformasi numerik terhadap teks adalah langkah pertama agar Anda dapat memahami sentimen dalam teks. Vektorisasi Tfidf adalah cara lain untuk membangun kosakata dari kolom sentimen kita.

Latihan ini adalah bagian dari kursus

Analisis Sentimen dengan Python

Lihat Kursus

Petunjuk latihan

  • Impor fungsi untuk membangun vektorisator TfIdf dari sklearn.feature_extraction.text.
  • Panggil fungsi TfidfVectorizer() dan lakukan fit pada himpunan data annak.
  • Transformasikan vektorisator.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import the required function
____

annak = ['Happy families are all alike;', 'every unhappy family is unhappy in its own way']

# Call the vectorizer and fit it
anna_vect = ____.___(annak)

# Create the tfidf representation
anna_tfidf = anna_vect.____(annak)

# Print the result 
print(anna_tfidf.toarray())
Edit dan Jalankan Kode