Ontbrekende vertragingen?
In de vorige oefening zag je dat er kolommen in flights zijn met ontbrekende waarden. Hieronder staat het resultaat van de functie describe(). Je maakt je niet zo druk om ontbrekende waarden in de meeste kolommen, maar ontbrekende waarden in de kolom departure_delay zijn problematisch — dat is een van de belangrijkste kolommen die je wilt onderzoeken.
Row variable nmissing
Symbol Int64
__________________________________
1 year 0
2 month 0
3 day 0
4 day_of_week 0
5 airline 0
6 flight_number 4
7 origin_airport 0
8 destination_airport 3
9 scheduled_departure 7
10 departure_time 3
11 departure_delay 56
12 scheduled_time 0
Het pakket DataFrames en de gegevensset flights zijn voor je geladen.
Deze oefening maakt deel uit van de cursus
Data manipulatie in Julia
Oefeninstructies
- Verwijder alleen de ontbrekende waarden uit de kolom
departure_delayen sla het resultaat in-place op. - Print het resultaat van
describe()om je werk te controleren.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Drop missing values from departure_delay
____
# Print describe
____