Rusça tweet'lerin karakter sayısı
Bu egzersizde, FiveThirtyEight tarafından derlenen ve Rusya'nın Internet Research Agency'si ile ilişkili bazı tweet'leri içeren tweets adlı bir veri çerçevesi verildi.
Görevin, her tweet için karakter sayısını hesaplayan tweets içinde 'char_count' adlı yeni bir özellik oluşturmak. Ayrıca, tweet'lerin ortalama uzunluğunu da hesapla. Tweet'ler tweets veri çerçevesindeki content özelliğinde bulunuyor.
Twitter'dan alınmış gerçek veriler kullanıldığı için (bu egzersizde ve gerçek Twitter verisi kullanılan sonraki egzersizlerde) küfür ya da rahatsız edici içerik içerebileceğini unutma.
Bu egzersiz
Python ile NLP için Özellik Mühendisliği
kursunun bir parçasıdırEgzersiz talimatları
tweetsiçindeki 'content' özelliğinelenuygulayarak yeni birchar_countözelliği oluştur.- 'char_count' özelliğinin ortalamasını hesaplayarak tweet'lerin ortalama karakter sayısını yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create a feature char_count
tweets['char_count'] = tweets[____].apply(____)
# Print the average character count
print(tweets[____].____)