1. Apprendre
  2. /
  3. Cours
  4. /
  5. Importation intermédiaire de données en Python

Connected

Exercice

Un peu d'analyse de texte sur Twitter

Maintenant que votre DataFrame de gazouillis est prêt, vous allez faire un peu d'analyse de texte pour compter combien de gazouillis contiennent les mots 'clinton', 'trump', 'sanders' et 'cruz'. Dans le code avant l'exercice, nous avons défini la fonction suivante word_in_text(), qui vous dira si le premier argument (un mot) se trouve dans le deuxième argument (un gazouillis).

import re

def word_in_text(word, text):
    word = word.lower()
    text = text.lower()
    match = re.search(word, text)

    if match:
        return True
    return False

Vous allez parcourir les lignes du DataFrame et calculer combien de gazouillis contiennent chacun de nos mots-clés ! La liste d'objets pour chaque candidate et candidat a été initialisée à 0.

Instructions

100 XP
  • Dans la boucle for for index, row in df.iterrows():, le code augmente actuellement la valeur de clinton de 1 chaque fois qu'un gazouillis (ligne de texte) mentionnant « Clinton » est repéré ; complétez le code pour que la même chose se produise pour trump, sanders et cruz.