Conteggio dei caratteri dei tweet russi
In questo esercizio ti viene fornito un dataframe tweets che contiene alcuni tweet associati alla Internet Research Agency russa e raccolti da FiveThirtyEight.
Il tuo compito è creare in tweets una nuova caratteristica 'char_count' che calcoli il numero di caratteri per ogni tweet. Inoltre, calcola la lunghezza media dei tweet. I tweet sono disponibili nella caratteristica content di tweets.
Tieni presente che si tratta di dati reali provenienti da Twitter e, come tali, potrebbero contenere linguaggio volgare o altri contenuti offensivi (in questo esercizio e in tutti quelli successivi che utilizzano dati reali di Twitter).
Questo esercizio fa parte del corso
Feature Engineering per NLP in Python
Istruzioni dell'esercizio
- Crea una nuova caratteristica
char_countapplicandolenalla caratteristica 'content' ditweets. - Stampa il numero medio di caratteri dei tweet calcolando la media della caratteristica 'char_count'.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a feature char_count
tweets['char_count'] = tweets[____].apply(____)
# Print the average character count
print(tweets[____].____)