Contagem de caracteres de tweets russos
Neste exercício, você recebeu um dataframe tweets que contém alguns tweets associados à Internet Research Agency da Rússia e compilados pela FiveThirtyEight.
Sua tarefa é criar uma nova feature 'char_count' em tweets que calcula o número de caracteres de cada tweet. Além disso, calcule o comprimento médio de cada tweet. Os tweets estão disponíveis na feature content de tweets.
Fique atento: estes são dados reais do Twitter e, por isso, há sempre o risco de conterem palavrões ou outro conteúdo ofensivo (neste exercício e em quaisquer exercícios seguintes que também usem dados reais do Twitter).
Este exercício faz parte do curso
Feature Engineering para NLP em Python
Instruções do exercício
- Crie uma nova feature
char_countaplicandolenà feature 'content' detweets. - Imprima a contagem média de caracteres dos tweets calculando a média da feature 'char_count'.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a feature char_count
tweets['char_count'] = tweets[____].apply(____)
# Print the average character count
print(tweets[____].____)