Buscar palabras clave
Contar palabras clave conocidas es una de las primeras formas de analizar texto en un conjunto de datos de Twitter. En este conjunto, vas a contar cuántas veces aparecen hashtags específicos en una colección de tuits sobre data science. Para ello, vas a usar los métodos de cadena del objeto Series de pandas.
pandas y numpy se han importado como pd y np, respectivamente. También se han cargado para ti una versión más completa de flatten_tweets y data_science_json.
Este ejercicio forma parte del curso
Análisis de datos de redes sociales con Python
Instrucciones del ejercicio
- Aplana los tuits con
flatten_tweets()y guárdalos enflat_tweets. - Convierte los tuits a DataFrame usando el constructor DataFrame de pandas.
- Busca menciones de
#pythonen'text', ignorando mayúsculas y minúsculas. - Imprime la proporción de tuits que mencionan
#pythonsumandopythonconnp.sum()y dividiéndolo entre el número total de tuits.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Flatten the tweets and store them
____ = ____(____)
# Convert to DataFrame
ds_tweets = ____.____(____)
# Find mentions of #python in 'text'
python = ____[____].____.____(____, ____)
# Print proportion of tweets mentioning #python
print("Proportion of #python tweets:", ____ / ____)