ComeçarComece de graça

Procurando texto nos lugares errados

Lembre-se de que o texto relevante pode não estar apenas no campo principal text do tweet. Ele também pode aparecer em extended_tweet, retweeted_status ou quoted_status. Precisamos verificar todos esses campos para garantir que capturamos todo o texto relevante. Vamos fazer isso com frequência, então vamos criar uma função para isso.

As duas primeiras linhas verificam se o campo principal text ou extended_tweet contém o texto. Você vai precisar verificar o restante.

Este exercício faz parte do curso

Analisando dados de mídias sociais em Python

Ver curso

Instruções do exercício

Finalize a função check_word_in_tweet fazendo o seguinte:

  • Verifique se o campo quoted_status-text contém a palavra.
  • Verifique se o campo quoted_status-extended_tweet-full_text contém a palavra.
  • Verifique se o campo retweeted_status-text contém a palavra.
  • Verifique se o campo retweeted_status-extended_tweet-full_text contém a palavra.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

def check_word_in_tweet(word, data):
    """Checks if a word is in a Twitter dataset's text. 
    Checks text and extended tweet (140+ character tweets) for tweets,
    retweets and quoted tweets.
    Returns a logical pandas Series.
    """
    contains_column = data['text'].str.contains(word, case = False)
    contains_column |= data['extended_tweet-full_text'].str.contains(word, case = False)
    contains_column |= data[____].str.contains(word, case = False)
    contains_column |= data[____].____.____(____, case = False)
    contains_column |= data[____].____.____(____, ____)
    contains_column |= ____[____].____.____(____, ____)
    return contains_column
Editar e executar o código