TfIdf pertama Anda
Dalam latihan ini, Anda akan menerapkan metode TfIdf pada himpunan data kecil annak, yang memuat kalimat pertama dari Anna Karenina karya Leo Tolstoy.
Tugas Anda adalah bekerja dengan himpunan data ini dan menerapkan fungsi TfidfVectorizer(). Ingat bahwa melakukan transformasi numerik terhadap teks adalah langkah pertama agar Anda dapat memahami sentimen dalam teks. Vektorisasi Tfidf adalah cara lain untuk membangun kosakata dari kolom sentimen kita.
Latihan ini adalah bagian dari kursus
Analisis Sentimen dengan Python
Petunjuk latihan
- Impor fungsi untuk membangun vektorisator TfIdf dari
sklearn.feature_extraction.text. - Panggil fungsi
TfidfVectorizer()dan lakukan fit pada himpunan dataannak. - Transformasikan vektorisator.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import the required function
____
annak = ['Happy families are all alike;', 'every unhappy family is unhappy in its own way']
# Call the vectorizer and fit it
anna_vect = ____.___(annak)
# Create the tfidf representation
anna_tfidf = anna_vect.____(annak)
# Print the result
print(anna_tfidf.toarray())