ComenzarEmpieza gratis

Buscar palabras clave

Contar palabras clave conocidas es una de las primeras formas de analizar texto en un conjunto de datos de Twitter. En este conjunto, vas a contar cuántas veces aparecen hashtags específicos en una colección de tuits sobre data science. Para ello, vas a usar los métodos de cadena del objeto Series de pandas.

pandas y numpy se han importado como pd y np, respectivamente. También se han cargado para ti una versión más completa de flatten_tweets y data_science_json.

Este ejercicio forma parte del curso

Análisis de datos de redes sociales con Python

Ver curso

Instrucciones del ejercicio

  • Aplana los tuits con flatten_tweets() y guárdalos en flat_tweets.
  • Convierte los tuits a DataFrame usando el constructor DataFrame de pandas.
  • Busca menciones de #python en 'text', ignorando mayúsculas y minúsculas.
  • Imprime la proporción de tuits que mencionan #python sumando python con np.sum() y dividiéndolo entre el número total de tuits.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Flatten the tweets and store them
____ = ____(____)

# Convert to DataFrame
ds_tweets = ____.____(____)

# Find mentions of #python in 'text'
python = ____[____].____.____(____, ____)

# Print proportion of tweets mentioning #python
print("Proportion of #python tweets:", ____ / ____)
Editar y ejecutar código