1. Apprendre
  2. /
  3. Cours
  4. /
  5. Manipulation de données avec dplyr

Connected

Exercice

Utiliser summarize, slice_max et count ensemble

Dans ce chapitre, vous avez appris à utiliser six verbes dplyr liés à l'agrégation : count(), group_by(), summarize(), ungroup(), slice_max() et slice_min(). Dans cet exercice, vous allez les combiner pour répondre à la question suivante :

Dans combien d'États la population des zones métropolitaines est-elle plus nombreuse que celle des zones non métropolitaines?

Rappelez-vous que la colonne metro prend l'une des deux valeurs "Metro" (pour les zones urbaines à forte densité) ou "Nonmetro" (pour les zones suburbaines et rurales).

counties_selected <- counties %>%
  select(state, metro, population)

Instructions 1/3

undefined XP
  • 1

    Pour chaque combinaison de state et metro, calculez la population totale sous le nom total_pop.

  • 2

    Extrayez la ligne la plus peuplée de chaque État, qui sera soit Metro soit Nonmetro.

  • 3

    Retirez le groupement, puis comptez le nombre d'occurrences de Metro et de Nonmetro pour voir combien d'États ont plus d'habitants dans ces zones.