URL'leri ve harf dışındaki karakterleri kaldır
Twitter kullanıcılarının paylaştığı tweet metinleri yapılandırılmamış, gürültülü ve hamdır.
Duygu simgeleri, URL'ler ve sayılar içerir. Güvenilir sonuçlar elde etmek için bu fazlalık bilgileri analizden önce temizlemek gerekir.
Bu egzersizde, URL'leri kaldıracak ve harf olmayan karakterleri boşluklarla değiştireceksin.
"telemedicine" hakkında çıkarılmış 1000 tweet içeren twt_telmed tweet veri çerçevesi bu egzersiz için önceden yüklendi.
qdapRegex kütüphanesi bu egzersiz için önceden yüklendi.
Bu egzersiz
R ile Sosyal Medya Verilerini Analiz Etme
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Extract tweet text from the pre-loaded dataset
twt_txt <- ___$___
head(twt_txt)