Biraz Twitter metin analizi

Artık tweet'lerden oluşan DataFrame'ini hazırladığına göre, içinde 'clinton', 'trump', 'sanders' ve 'cruz' kelimeleri geçen kaç tweet olduğunu saymak için biraz metin analizi yapacaksın. Egzersiz öncesi kodda, birinci argüman (bir kelime) ikinci argüman (bir tweet) içinde geçiyor mu söyleyen word_in_text() fonksiyonunu tanımladık.

import re

def word_in_text(word, text):
    word = word.lower()
    text = text.lower()
    match = re.search(word, text)

    if match:
        return True
    return False

DataFrame'in satırlarında dolaşıp anahtar kelimelerimizin her birini içeren kaç tweet olduğunu hesaplayacaksın! Her bir aday için nesnelerin listesi 0'a ayarlanmış durumda.

Bu egzersiz, kursun bir parçasıdır

Python'da Orta Düzey Veri İçe Aktarma

Kursa Göz Atın

Egzersiz talimatları

for index, row in df.iterrows(): for döngüsünde, kod şu anda 'Clinton' geçen her tweet'te (text satırı) clinton değerini 1 artırıyor; aynı işlemin trump, sanders ve cruz için de gerçekleşmesi için kodu tamamla.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Initialize list to store tweet counts
[clinton, trump, sanders, cruz] = [0, 0, 0, 0]

# Iterate through df, counting the number of tweets in which
# each candidate is mentioned
for index, row in df.iterrows():
    clinton += word_in_text('clinton', row['text'])
    trump += word_in_text(____, ____)
    sanders += word_in_text(____, ____)
    cruz += word_in_text(____, ____)

Kodu Düzenle ve Çalıştır