Encontrando palavras-chave
Contar palavras-chave conhecidas é uma das primeiras maneiras de analisar dados de texto em um conjunto de dados do Twitter. Neste conjunto, você vai contar quantas vezes hashtags específicas aparecem em uma coleção de tweets sobre data science. Para isso, você vai usar os métodos de string do objeto Series do pandas.
pandas e numpy já foram importados como pd e np, respectivamente. Uma versão mais completa de flatten_tweets e data_science_json também foi carregada para você.
Este exercício faz parte do curso
Analisando dados de mídias sociais em Python
Instruções do exercício
- Achate os tweets com
flatten_tweets()e armazene emflat_tweets. - Converta os tweets para DataFrame usando o construtor DataFrame do pandas.
- Encontre menções a
#pythonem'text', ignorando maiúsculas/minúsculas. - Imprima a proporção de tweets que mencionam
#pythonsomandopythoncomnp.sum()e dividindo pelo número total de tweets.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Flatten the tweets and store them
____ = ____(____)
# Convert to DataFrame
ds_tweets = ____.____(____)
# Find mentions of #python in 'text'
python = ____[____].____.____(____, ____)
# Print proportion of tweets mentioning #python
print("Proportion of #python tweets:", ____ / ____)