Aan de slagGa gratis aan de slag

Datavalidatie implementeren

Na het succesvol inlezen van de marktbestanden heb je gezien dat sommige bestanden leeg zijn of belangrijke kolommen missen. Voordat je complexe analyses uitvoert, moet je basiscontroles inbouwen om te valideren dat de gegevensbestanden bruikbaar zijn. Dit helpt fouten later in je dataverwerkingspipeline te voorkomen.

De klassen Files, Path, Paths en List zijn al voor je geïmporteerd.

Deze oefening maakt deel uit van de cursus

Data importeren in Java

Cursus bekijken

Oefeninstructies

  • Lees alle regels uit het bestand in een lijst.
  • Controleer of het bestand leeg is.
  • Controleer of de header de verwachte kolomnamen bevat: Date en Ticker.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

public class SimpleDataValidation {
    public static void main(String[] args) {
        try {
            // Read all lines from the file
            Path path = Paths.____("sample_market_data.csv");
            List lines = Files.____(path);
            
            // Check if the file is empty
            System.out.println("File is empty: " + ____.____());
            
            // Verify the header contains expected column names
            if (!lines.isEmpty()) {
                String firstLine = lines.get(0);
                System.out.println("First line: " + firstLine);
                System.out.println("Contains 'Date': " + firstLine.____("____"));
                System.out.println("Contains 'Ticker': " + firstLine.contains("____"));
                System.out.println("Total lines: " + lines.size());
            }
        } catch (IOException e) {
            System.err.println("Error reading file: " + e.getMessage());
        }
    }
}
Code bewerken en uitvoeren