Ontbrekende observaties vinden
Je bent inspecteur in een kerncentrale en moet controleren of elke reactor gedurende een heel jaar zijn dagelijkse veiligheidscheck heeft gekregen. De logbestanden van de veiligheidschecks staan in reactor_df, een data frame met de kolommen date, reactor en check.
Twee vectoren, dates en reactors, met respectievelijk alle dagen van het jaar en alle reactors in de centrale, zijn al voor je aangemaakt.
Je gebruikt de combinatie van de functies expand_grid() en anti_join() om data te vinden waarop bepaalde reactors niet zijn gecontroleerd.
Het pakket dplyr is alvast voor je geladen.
Deze oefening maakt deel uit van de cursus
Data herstructureren met tidyr
Oefeninstructies
- Gebruik de functie
expand_grid()om een tibble te maken met alle combinaties van de variabelendateenreactor. Gebruik hiervoor de vectorendatesenreactorsdie voor je zijn aangemaakt. - Voer een anti-join uit tussen
full_dfenreactor_dfop de kolommendateenreactor.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a tibble with all combinations of dates and reactors
full_df <- ___
# Find the reactor - date combinations not present in reactor_df
full_df %>%
___