or
Cet exercice fait partie du cours
Comment montrer l’ensemble de vos données tout en veillant à ce que le public ne passe pas à côté d’un point essentiel ? Nous expliquons ici comment guider l’attention grâce à des mises en évidence basées sur la couleur et du texte. Nous présentons aussi un jeu de données sur les principaux polluants aux États‑Unis.
La couleur est un outil puissant pour encoder des valeurs en visualisation de données. Mais ce pouvoir s’accompagne de risques. Dans ce chapitre, nous expliquons comment choisir une palette de couleurs adaptée à votre visualisation en fonction du type de données représenté.
L’incertitude est omniprésente en data science, mais elle est souvent absente des visualisations alors qu’elle devrait y figurer. Ici, nous revenons sur la notion d’intervalle de confiance et sur la façon de le représenter, à la fois pour des estimations ponctuelles et des fonctions continues. Nous abordons également la technique de rééchantillonnage bootstrap pour évaluer l’incertitude et comment la visualiser correctement.
La visualisation est souvent enseignée isolément, avec des bonnes pratiques présentées de manière générale. En réalité, vous devrez parfois assouplir les règles selon les contextes. Des visualisations exploratoires parfois brouillonnes jusqu’au réglage fin des tailles de police de votre livrable final : dans ce chapitre, nous voyons comment optimiser vos visualisations à chaque étape d’un flux de travail en data science.
Exercice en cours