IniziaInizia gratis

Raggruppare e rimodellare colonne simili

In questa lezione, abbiamo visto come alcune colonne del dataset del sondaggio di data science su Kaggle fossero collegate tra loro, ad esempio le colonne che indicano la frequenza di diverse sfide lavorative. Di solito vogliamo analizzare quelle variabili insieme, ma prima dobbiamo individuarle e trasformarle in un formato più facile da usare. Proviamo il processo con le domande su quanto gli intervistati abbiano trovato utili le diverse piattaforme per l'apprendimento.

Il dataset multiple_choice_responses è già stato caricato per te.

Questo esercizio fa parte del corso

Dati categoriali nel Tidyverse

Visualizza il corso

Istruzioni dell'esercizio

  • Seleziona solo le colonne con "LearningPlatformUsefulness" nel nome.
  • Trasforma i dati dal formato wide al formato long con due colonne, learning_platform e usefulness.
  • Rimuovi le righe in cui usefulness è NA.
  • Rimuovi "LearningPlatformUsefulness" da ogni stringa in learning_platform.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

learning_platform_usefulness <- multiple_choice_responses %>%
  # Select columns with LearningPlatformUsefulness in title
  ___(___("LearningPlatformUsefulness")) %>%
  # Change data from wide to long
  ___(everything(), names_to = "learning_platform", values_to = "usefulness") %>%
  # Remove rows where usefulness is NA
  ___(___()) %>%
  # Remove "LearningPlatformUsefulness" from each string in learning_platform 
  mutate(learning_platform = ___())
Modifica ed esegui il codice