Hoe kan ik het begin van een bestand bekijken?
Het eerste wat de meeste data scientists doen met een nieuwe gegevensset is bekijken welke velden erin zitten en welke waarden die velden hebben. Als de gegevensset uit een database of spreadsheet is geëxporteerd, wordt die vaak opgeslagen als comma-separated values (CSV). Een snelle manier om te zien wat erin staat, is de eerste paar rijen bekijken.
Dat kan in de shell met een opdracht genaamd head.
Zoals de naam al aangeeft,
die print de eerste paar regels van een bestand
(waarbij "een paar" 10 betekent),
dus de opdracht:
head seasonal/summer.csv
geeft weer:
Date,Tooth
2017-01-11,canine
2017-01-18,wisdom
2017-01-21,bicuspid
2017-02-02,molar
2017-02-27,wisdom
2017-02-27,wisdom
2017-03-07,bicuspid
2017-03-15,wisdom
2017-03-20,canine
Wat doet head als er geen 10 regels in het bestand staan?
(Om dat te ontdekken, gebruik het om naar de bovenkant van people/agarwal.txt te kijken.)
Deze oefening maakt deel uit van de cursus
Introductie tot de shell
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen