Aan de slagGa gratis aan de slag

Ontbrekende observaties vinden

Je bent inspecteur in een kerncentrale en moet controleren of elke reactor gedurende een heel jaar zijn dagelijkse veiligheidscheck heeft gekregen. De logbestanden van de veiligheidschecks staan in reactor_df, een data frame met de kolommen date, reactor en check.

Twee vectoren, dates en reactors, met respectievelijk alle dagen van het jaar en alle reactors in de centrale, zijn al voor je aangemaakt. Je gebruikt de combinatie van de functies expand_grid() en anti_join() om data te vinden waarop bepaalde reactors niet zijn gecontroleerd.

Het pakket dplyr is alvast voor je geladen.

Deze oefening maakt deel uit van de cursus

Data herstructureren met tidyr

Cursus bekijken

Oefeninstructies

  • Gebruik de functie expand_grid() om een tibble te maken met alle combinaties van de variabelen date en reactor. Gebruik hiervoor de vectoren dates en reactors die voor je zijn aangemaakt.
  • Voer een anti-join uit tussen full_df en reactor_df op de kolommen date en reactor.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a tibble with all combinations of dates and reactors
full_df <- ___

# Find the reactor - date combinations not present in reactor_df
full_df %>% 
  ___
Code bewerken en uitvoeren