Recuento de caracteres de tuits rusos
En este ejercicio tienes un dataframe tweets con algunos tuits asociados a la Internet Research Agency de Rusia y recopilados por FiveThirtyEight.
Tu tarea es crear una nueva característica char_count en tweets que calcule el número de caracteres de cada tuit. Además, calcula la longitud media de los tuits. Los tuits están en la columna content de tweets.
Ten en cuenta que se trata de datos reales de Twitter y, por tanto, existe el riesgo de que contengan lenguaje soez u otro contenido ofensivo (en este ejercicio y en cualquier otro que use datos reales de Twitter).
Este ejercicio forma parte del curso
Ingeniería de características para NLP en Python
Instrucciones del ejercicio
- Crea una nueva característica
char_countaplicandolena la columnacontentdetweets. - Imprime el recuento medio de caracteres de los tuits calculando la media de la característica
char_count.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a feature char_count
tweets['char_count'] = tweets[____].apply(____)
# Print the average character count
print(tweets[____].____)