1. Apprendre
  2. /
  3. Cours
  4. /
  5. Introduction à la visualisation de données avec ggplot2

Connected

Exercice

Surtracé 4 : Données entières

Voyons le dernier cas pour gérer le surtracé :

  1. Données entières

Cela peut être du type integer (p. ex. 1, 2, 3…) ou des variables catégorielles (p. ex. de classe factor). factor est simplement une classe particulière basée sur le type integer.

Vous aurez généralement un petit nombre défini d'intersections entre deux variables, ce qui ressemble au cas 3, mais vous pourriez passer à côté si vous ne réalisez pas que les données de type entier et facteur correspondent à des données de faible précision.

Le jeu de données Vocab fourni contient le nombre d'années de scolarité et les résultats à un test de vocabulaire de répondants aux enquêtes sociales générales américaines, de 1972 à 2004.

Instructions 1/4

undefined XP
  • 1
    • Examinez le jeu de données Vocab à l'aide de str().
    • En utilisant Vocab, tracez vocabulary en fonction de education.
    • Ajoutez une couche de points.
  • 2
    • Remplacez la couche de points par une couche de dispersion aléatoire (jitter).
  • 3
    • Réglez la transparence du jitter à 0.2.
  • 4
    • Définissez la forme des points dispersés en cercles vides (forme 1).