MulaiMulai sekarang secara gratis

Jumlah karakter pada tweet berbahasa Rusia

Dalam latihan ini, Anda diberikan sebuah dataframe tweets yang berisi beberapa tweet yang terkait dengan Internet Research Agency Rusia dan disusun oleh FiveThirtyEight.

Tugas Anda adalah membuat fitur baru 'char_count' di tweets yang menghitung jumlah karakter untuk setiap tweet. Selain itu, hitung juga panjang rata-rata setiap tweet. Tweet tersedia pada fitur content di tweets.

Harap diketahui bahwa ini adalah data asli dari Twitter, sehingga selalu ada kemungkinan mengandung kata-kata kasar atau konten yang menyinggung (baik pada latihan ini maupun latihan lain berikutnya yang juga menggunakan data Twitter asli).

Latihan ini adalah bagian dari kursus

Rekayasa Fitur untuk NLP di Python

Lihat Kursus

Petunjuk latihan

  • Buat fitur baru char_count dengan menerapkan len pada fitur 'content' dari tweets.
  • Cetak jumlah karakter rata-rata dari tweet dengan menghitung mean pada fitur 'char_count'.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a feature char_count
tweets['char_count'] = tweets[____].apply(____)

# Print the average character count
print(tweets[____].____)
Edit dan Jalankan Kode