Eerste verkenning van de data
Je bent een nieuwe data-analist bij TechCorp. HR wil voor de budgetplanning een gerichte weergave van grootverdieners, maar de volledige medewerkerstabel bevat tientallen kolommen. Door alleen de relevante kolommen te selecteren, verminder je ruis en wordt je analyse duidelijker voor jou en voor stakeholders die je resultaten bekijken.
De Table-klasse en gerelateerde Tablesaw-klassen zijn al voor je geïmporteerd.
Deze oefening maakt deel uit van de cursus
Data importeren in Java
Oefeninstructies
- Selecteer de kolommen:
"Name","Department","JobTitle","Salary","Age". - Filter op salarissen boven $60.000.
- Sorteer aflopend op salaris.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
public class DataExploration {
public static void main(String[] args) {
try {
Table employees = Table.read().csv("employees.csv");
// Select the essential columns
Table essentialData = employees.____("Name", "Department", "JobTitle", "Salary", "Age");
// Filter for salaries above $60,000
Table highEarners = essentialData.____(
essentialData.intColumn("____").____(60000));
// Sort by salary descending
Table sortedHighEarners = highEarners.____("____");
System.out.println("Top 10 Highest Earning Employees:");
System.out.println(sortedHighEarners.first(10));
} catch (Exception e) {
System.err.println("Error reading CSV files: " + e.getMessage());
}
}
}