Recuento de caracteres de tuits rusos

En este ejercicio tienes un dataframe tweets con algunos tuits asociados a la Internet Research Agency de Rusia y recopilados por FiveThirtyEight.

Tu tarea es crear una nueva característica char_count en tweets que calcule el número de caracteres de cada tuit. Además, calcula la longitud media de los tuits. Los tuits están en la columna content de tweets.

Ten en cuenta que se trata de datos reales de Twitter y, por tanto, existe el riesgo de que contengan lenguaje soez u otro contenido ofensivo (en este ejercicio y en cualquier otro que use datos reales de Twitter).

Este ejercicio forma parte del curso

Ingeniería de características para NLP en Python

Ver curso

Instrucciones del ejercicio

Crea una nueva característica char_count aplicando len a la columna content de tweets.
Imprime el recuento medio de caracteres de los tuits calculando la media de la característica char_count.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Create a feature char_count
tweets['char_count'] = tweets[____].apply(____)

# Print the average character count
print(tweets[____].____)

Editar y ejecutar código