Aan de slagGa gratis aan de slag

Verwijder URL's en andere tekens dan letters

Tweet-tekst die door twittergebruikers wordt geplaatst is ongestructureerd, rommelig en rauw.

Er zitten emoticons, URL's en cijfers in. Deze overbodige informatie moet worden opgeschoond voordat je gaat analyseren, zodat je betrouwbare resultaten krijgt.

In deze oefening verwijder je URL's en vervang je alle tekens die geen letters zijn door spaties.

De data frame met tweets twt_telmed, met 1000 verzamelde tweets over "telemedicine", is al voor je geladen voor deze oefening.

De bibliotheek qdapRegex is al voor je geladen voor deze oefening.

Deze oefening maakt deel uit van de cursus

Socialemediagegevens analyseren in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Extract tweet text from the pre-loaded dataset
twt_txt <- ___$___
head(twt_txt)
Code bewerken en uitvoeren