Encontrando palavras-chave
Contar palavras-chave conhecidas é uma das primeiras maneiras de analisar dados de texto em um conjunto de dados do Twitter. Neste conjunto, você vai contar quantas vezes hashtags específicas aparecem em uma coleção de tweets sobre data science. Para isso, você vai usar os métodos de string do objeto Series do pandas.
pandas e numpy já foram importados como pd e np, respectivamente. Uma versão mais completa de flatten_tweets e data_science_json também foi carregada para você.
Este exercicio faz parte do curso
Analisando dados de mídias sociais em Python
Instruções do exercicio
- Achate os tweets com
flatten_tweets()e armazene emflat_tweets. - Converta os tweets para DataFrame usando o construtor DataFrame do pandas.
- Encontre menções a
#pythonem'text', ignorando maiúsculas/minúsculas. - Imprima a proporção de tweets que mencionam
#pythonsomandopythoncomnp.sum()e dividindo pelo número total de tweets.
exercicio interativo prático
Tente este exercicio completando este código de exemplo.
# Flatten the tweets and store them
____ = ____(____)
# Convert to DataFrame
ds_tweets = ____.____(____)
# Find mentions of #python in 'text'
python = ____[____].____.____(____, ____)
# Print proportion of tweets mentioning #python
print("Proportion of #python tweets:", ____ / ____)