CSV-bestanden lezen
Je bent begonnen bij DataCorp als junior data-analist. Je eerste project draait om het consolideren van de medewerkersdatabase, maar de data komt uit meerdere systemen met verschillende CSV-indelingen: sommige comma-gescheiden, andere tab-gescheiden. Met verschillende bestandsformaten kunnen omgaan is essentieel, omdat data in de praktijk zelden in één gestandaardiseerd formaat komt.
De klassen Table, CsvReadOptions en aanverwante Tablesaw-klassen zijn al voor je geïmporteerd.
Deze oefening maakt deel uit van de cursus
Data importeren in Java
Oefeninstructies
- Lees
"employees.csv"in met de standaardopties. - Lees
"employees_tab.csv"in met een tab als scheidingsteken. - Print de structuur van beide tabellen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
public class ReadCSVFiles {
public static void main(String[] args) {
try {
// Read file using default options
Table standardCsv = Table.____().____("employees.csv");
// Read file using a tab delimiter
Table tabDelimited = Table.read().csv(CsvReadOptions
.____("employees_tab.csv")
.____('\t')
.build());
// Print the structure of both tables
System.out.println(____.____());
System.out.println(____.____());
} catch (Exception e) {
System.err.println("Error reading CSV files: " + e.getMessage());
}
}
}