ComeçarComece de graça

Contagem de caracteres de tweets russos

Neste exercício, você recebeu um dataframe tweets que contém alguns tweets associados à Internet Research Agency da Rússia e compilados pela FiveThirtyEight.

Sua tarefa é criar uma nova feature 'char_count' em tweets que calcula o número de caracteres de cada tweet. Além disso, calcule o comprimento médio de cada tweet. Os tweets estão disponíveis na feature content de tweets.

Fique atento: estes são dados reais do Twitter e, por isso, há sempre o risco de conterem palavrões ou outro conteúdo ofensivo (neste exercício e em quaisquer exercícios seguintes que também usem dados reais do Twitter).

Este exercício faz parte do curso

Feature Engineering para NLP em Python

Ver curso

Instruções do exercício

  • Crie uma nova feature char_count aplicando len à feature 'content' de tweets.
  • Imprima a contagem média de caracteres dos tweets calculando a média da feature 'char_count'.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a feature char_count
tweets['char_count'] = tweets[____].apply(____)

# Print the average character count
print(tweets[____].____)
Editar e executar o código