Visualiser les questions et les réponses par balise
Dans le dernier exercice, vous avez modifié la table posts_with_tags pour ajouter une colonne year, puis vous avez agrégé par type, year et tag_name. La table modifiée est déjà chargée sous le nom by_type_year_tag et contient une observation pour chaque type (question/réponse), année et balise. Créons un graphique pour examiner les informations que cette table contient sur les questions et réponses pour les balises dplyr et ggplot2. Le package ggplot2 a été préchargé pour vous.
by_type_year_tag <- posts_with_tags %>%
mutate(year = year(creation_date)) %>%
count(type, year, tag_name)
Cet exercice fait partie du cours
Assembler des données avec dplyr
Instructions
- Filtrez la table
by_type_year_tagpour les balises dplyr et ggplot2. - Créez un graphique en courbes avec cette table filtrée qui trace la fréquence (
n) au fil du temps, colorée par question/réponse et avec un facet par balise.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Filter for the dplyr and ggplot2 tag names
by_type_year_tag_filtered <- by_type_year_tag %>%
filter(___)
# Create a line plot faceted by the tag name
ggplot(by_type_year_tag_filtered, aes(___, ___, color = ___)) +
geom_line() +
facet_wrap(~ tag_name)