Encontrando palavras-chave

Contar palavras-chave conhecidas é uma das primeiras maneiras de analisar dados de texto em um conjunto de dados do Twitter. Neste conjunto, você vai contar quantas vezes hashtags específicas aparecem em uma coleção de tweets sobre data science. Para isso, você vai usar os métodos de string do objeto Series do pandas.

pandas e numpy já foram importados como pd e np, respectivamente. Uma versão mais completa de flatten_tweets e data_science_json também foi carregada para você.

Este exercício faz parte do curso

Analisando dados de mídias sociais em Python

Ver curso

Instruções do exercício

Achate os tweets com flatten_tweets() e armazene em flat_tweets.
Converta os tweets para DataFrame usando o construtor DataFrame do pandas.
Encontre menções a #python em 'text', ignorando maiúsculas/minúsculas.
Imprima a proporção de tweets que mencionam #python somando python com np.sum() e dividindo pelo número total de tweets.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Flatten the tweets and store them
____ = ____(____)

# Convert to DataFrame
ds_tweets = ____.____(____)

# Find mentions of #python in 'text'
python = ____[____].____.____(____, ____)

# Print proportion of tweets mentioning #python
print("Proportion of #python tweets:", ____ / ____)

Editar e executar o código