or
Deze oefening maakt deel uit van de cursus
Hoe laat je al je data zien zonder dat kijkers een belangrijk punt missen? We bespreken hoe je je kijker door de data leidt met kleuruitsnijdingen en tekst. We introduceren ook een gegevensset met veelvoorkomende verontreinigingswaarden in de Verenigde Staten.
Huidige oefening
Kleur is een krachtig hulpmiddel om waarden te coderen in datavisualisaties. Maar met die kracht komt ook risico. In dit hoofdstuk bespreken we hoe je een passend kleurpalet kiest voor je visualisatie op basis van het type data dat je toont.
Onzekerheid komt overal voor in data science, maar wordt vaak weggelaten uit visualisaties waar die juist thuishoort. Hier herhalen we wat een betrouwbaarheidsinterval is en hoe je die visualiseert voor zowel puntschattingen als continue functies. Daarnaast bespreken we de bootstrap-hersteekproeftechniek om onzekerheid te beoordelen en hoe je die correct visualiseert.
Vaak wordt visualisatie losstaand onderwezen, waarbij best practices alleen in algemene zin worden besproken. In de praktijk moet je de regels buigen voor verschillende scenario’s. Van rommelige verkennende visualisaties tot het finetunen van lettergroottes in je eindproduct: in dit hoofdstuk duiken we in hoe je je visualisaties optimaliseert in elke stap van een data science-workflow.