Rusça tweet'lerin karakter sayısı
Bu egzersizde, FiveThirtyEight tarafından derlenen ve Rusya'nın Internet Research Agency'si ile ilişkili bazı tweet'leri içeren tweets adlı bir veri çerçevesi verildi.
Görevin, her tweet için karakter sayısını hesaplayan tweets içinde 'char_count' adlı yeni bir özellik oluşturmak. Ayrıca, tweet'lerin ortalama uzunluğunu da hesapla. Tweet'ler tweets veri çerçevesindeki content özelliğinde bulunuyor.
Twitter'dan alınmış gerçek veriler kullanıldığı için (bu egzersizde ve gerçek Twitter verisi kullanılan sonraki egzersizlerde) küfür ya da rahatsız edici içerik içerebileceğini unutma.
Bu egzersiz, kursun bir parçasıdır
Python ile NLP için Özellik Mühendisliği
Egzersiz talimatları
tweetsiçindeki 'content' özelliğinelenuygulayarak yeni birchar_countözelliği oluştur.- 'char_count' özelliğinin ortalamasını hesaplayarak tweet'lerin ortalama karakter sayısını yazdır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create a feature char_count
tweets['char_count'] = tweets[____].apply(____)
# Print the average character count
print(tweets[____].____)