Aan de slagGa gratis aan de slag

Tekstkolommen omzetten naar factoren

Hoewel je soms het liefst meteen wilt beginnen met datavisualisatie en modelleren, moet je meestal eerst je data opschonen. In dit hoofdstuk doorloop je de stappen om een FiveThirtyEight-grafiek te reproduceren vanuit de originele gegevensset, flying_etiquette. We beginnen met het beperken van onze gegevensset tot alleen de respondenten die ons interesseren en maken van een paar kolommen factoren.

In de code zie je dat we backticks om de kolomnaam hebben gezet. Dat moet je doen als er spaties in je kolomnamen staan! Normaal vervangen we die door underscores zodat dit niet nodig is, maar in dit geval laten we het staan omdat we ze zo meteen gaan visualiseren.

Deze oefening maakt deel uit van de cursus

Categorische gegevens in de Tidyverse

Cursus bekijken

Oefeninstructies

  • Zet alle kolommen van het type character om naar factor-kolommen.
  • Verwijder mensen die "Never" hebben geantwoord op de vraag of ze ooit hebben gevlogen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

flying_etiquette %>%
    # Change characters to factors
    mutate(across(___(___), as.factor)) %>%
    # Filter out those who have never flown on a plane
    ___(`How often do you travel by plane?` != ___)
Code bewerken en uitvoeren