CommencerCommencer gratuitement

Chiens spatiaux soviétiques : vue côté chien

Vous allez travailler sur un échantillon prétraité de la base de données des chiens spatiaux de l’URSS, compilée par Duncan Geere et déjà chargée pour vous sous le nom space_dogs_df. Chacune des 42 lignes de ce jeu de données correspond à un tir de fusée d’essai ayant embarqué un ou deux chiens très courageux.

Votre objectif est de remanier ce jeu de données pour que, pour chaque lancement, chaque chien dispose de sa propre ligne.

La difficulté vient des en-têtes de colonnes (name_1, name_2, gender_1 et gender_2) : la partie avant le séparateur _ peut renvoyer à deux variables différentes (name et gender), tandis que la seconde partie renvoie toujours à l’identifiant du chien (1er ou 2e chien).

Laika

Laïka, premier animal à orbiter autour de la Terre en 1957

Cet exercice fait partie du cours

Reshaper des données avec tidyr

Afficher le cours

Instructions

  • En premier argument de pivot_longer(), passez les colonnes à pivoter (name_1, name_2, gender_1 et gender_2).
  • Complétez l’argument names_to afin que la première partie des en-têtes de colonnes soit réutilisée.
  • Assurez-vous de supprimer les valeurs NA, car toutes les fusées n’avaient pas deux chiens.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

space_dogs_df %>% 
  pivot_longer(
    # Add the columns to pivot
    ___,
    names_sep = "_",
    # Complete the names_to argument to re-use the first part of the column headers
    names_to = c(___,  "dog_id"),
    # Make sure NA values are dropped
    ___
  )
Modifier et exécuter le code