Jumlah karakter pada tweet berbahasa Rusia
Dalam latihan ini, Anda diberikan sebuah dataframe tweets yang berisi beberapa tweet yang terkait dengan Internet Research Agency Rusia dan disusun oleh FiveThirtyEight.
Tugas Anda adalah membuat fitur baru 'char_count' di tweets yang menghitung jumlah karakter untuk setiap tweet. Selain itu, hitung juga panjang rata-rata setiap tweet. Tweet tersedia pada fitur content di tweets.
Harap diketahui bahwa ini adalah data asli dari Twitter, sehingga selalu ada kemungkinan mengandung kata-kata kasar atau konten yang menyinggung (baik pada latihan ini maupun latihan lain berikutnya yang juga menggunakan data Twitter asli).
Latihan ini merupakan bagian dari kursus
Rekayasa Fitur untuk NLP di Python
Instruksi latihan
- Buat fitur baru
char_countdengan menerapkanlenpada fitur 'content' daritweets. - Cetak jumlah karakter rata-rata dari tweet dengan menghitung mean pada fitur 'char_count'.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create a feature char_count
tweets['char_count'] = tweets[____].apply(____)
# Print the average character count
print(tweets[____].____)