Conteggio dei caratteri dei tweet russi

In questo esercizio ti viene fornito un dataframe tweets che contiene alcuni tweet associati alla Internet Research Agency russa e raccolti da FiveThirtyEight.

Il tuo compito è creare in tweets una nuova caratteristica 'char_count' che calcoli il numero di caratteri per ogni tweet. Inoltre, calcola la lunghezza media dei tweet. I tweet sono disponibili nella caratteristica content di tweets.

Tieni presente che si tratta di dati reali provenienti da Twitter e, come tali, potrebbero contenere linguaggio volgare o altri contenuti offensivi (in questo esercizio e in tutti quelli successivi che utilizzano dati reali di Twitter).

Questo esercizio fa parte del corso

Feature Engineering per NLP in Python

Visualizza corso

Istruzioni dell'esercizio

Crea una nuova caratteristica char_count applicando len alla caratteristica 'content' di tweets.
Stampa il numero medio di caratteri dei tweet calcolando la media della caratteristica 'char_count'.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Create a feature char_count
tweets['char_count'] = tweets[____].apply(____)

# Print the average character count
print(tweets[____].____)

Modifica ed esegui il codice