Procurando texto nos lugares errados
Lembre-se de que o texto relevante pode não estar apenas no campo principal text do tweet. Ele também pode aparecer em extended_tweet, retweeted_status ou quoted_status. Precisamos verificar todos esses campos para garantir que capturamos todo o texto relevante. Vamos fazer isso com frequência, então vamos criar uma função para isso.
As duas primeiras linhas verificam se o campo principal text ou extended_tweet contém o texto. Você vai precisar verificar o restante.
Este exercício faz parte do curso
Analisando dados de mídias sociais em Python
Instruções do exercício
Finalize a função check_word_in_tweet fazendo o seguinte:
- Verifique se o campo
quoted_status-textcontém a palavra. - Verifique se o campo
quoted_status-extended_tweet-full_textcontém a palavra. - Verifique se o campo
retweeted_status-textcontém a palavra. - Verifique se o campo
retweeted_status-extended_tweet-full_textcontém a palavra.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def check_word_in_tweet(word, data):
"""Checks if a word is in a Twitter dataset's text.
Checks text and extended tweet (140+ character tweets) for tweets,
retweets and quoted tweets.
Returns a logical pandas Series.
"""
contains_column = data['text'].str.contains(word, case = False)
contains_column |= data['extended_tweet-full_text'].str.contains(word, case = False)
contains_column |= data[____].str.contains(word, case = False)
contains_column |= data[____].____.____(____, case = False)
contains_column |= data[____].____.____(____, ____)
contains_column |= ____[____].____.____(____, ____)
return contains_column