Aan de slagBegin gratis

Verwijder URL's en andere tekens dan letters

Tweet-tekst die door twittergebruikers wordt geplaatst is ongestructureerd, rommelig en rauw.

Er zitten emoticons, URL's en cijfers in. Deze overbodige informatie moet worden opgeschoond voordat je gaat analyseren, zodat je betrouwbare resultaten krijgt.

In deze oefening verwijder je URL's en vervang je alle tekens die geen letters zijn door spaties.

De data frame met tweets twt_telmed, met 1000 verzamelde tweets over "telemedicine", is al voor je geladen voor deze oefening.

De bibliotheek qdapRegex is al voor je geladen voor deze oefening.

Deze oefening maakt deel uit van de cursus

Socialemediagegevens analyseren in R

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Extract tweet text from the pre-loaded dataset
twt_txt <- ___$___
head(twt_txt)
Code bewerken en uitvoeren