Jumlah karakter pada tweet berbahasa Rusia
Dalam latihan ini, Anda diberikan sebuah dataframe tweets yang berisi beberapa tweet yang terkait dengan Internet Research Agency Rusia dan disusun oleh FiveThirtyEight.
Tugas Anda adalah membuat fitur baru 'char_count' di tweets yang menghitung jumlah karakter untuk setiap tweet. Selain itu, hitung juga panjang rata-rata setiap tweet. Tweet tersedia pada fitur content di tweets.
Harap diketahui bahwa ini adalah data asli dari Twitter, sehingga selalu ada kemungkinan mengandung kata-kata kasar atau konten yang menyinggung (baik pada latihan ini maupun latihan lain berikutnya yang juga menggunakan data Twitter asli).
Latihan ini adalah bagian dari kursus
Rekayasa Fitur untuk NLP di Python
Petunjuk latihan
- Buat fitur baru
char_countdengan menerapkanlenpada fitur 'content' daritweets. - Cetak jumlah karakter rata-rata dari tweet dengan menghitung mean pada fitur 'char_count'.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a feature char_count
tweets['char_count'] = tweets[____].apply(____)
# Print the average character count
print(tweets[____].____)