Datavalidatie implementeren
Na het succesvol inlezen van de marktbestanden heb je gezien dat sommige bestanden leeg zijn of belangrijke kolommen missen. Voordat je complexe analyses uitvoert, moet je basiscontroles inbouwen om te valideren dat de gegevensbestanden bruikbaar zijn. Dit helpt fouten later in je dataverwerkingspipeline te voorkomen.
De klassen Files, Path, Paths en List zijn al voor je geïmporteerd.
Deze oefening maakt deel uit van de cursus
Data importeren in Java
Oefeninstructies
- Lees alle regels uit het bestand in een lijst.
- Controleer of het bestand leeg is.
- Controleer of de header de verwachte kolomnamen bevat:
DateenTicker.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
public class SimpleDataValidation {
public static void main(String[] args) {
try {
// Read all lines from the file
Path path = Paths.____("sample_market_data.csv");
List lines = Files.____(path);
// Check if the file is empty
System.out.println("File is empty: " + ____.____());
// Verify the header contains expected column names
if (!lines.isEmpty()) {
String firstLine = lines.get(0);
System.out.println("First line: " + firstLine);
System.out.println("Contains 'Date': " + firstLine.____("____"));
System.out.println("Contains 'Ticker': " + firstLine.contains("____"));
System.out.println("Total lines: " + lines.size());
}
} catch (IOException e) {
System.err.println("Error reading file: " + e.getMessage());
}
}
}