LoslegenKostenlos loslegen

Fortgeschrittenes Filtern und Analysen

TechCorp möchte High-Potentials für ein Leadership-Programm identifizieren: junge Mitarbeitende (unter 30), die bereits Mid- oder Senior-Gehälter verdienen. Dazu musst du Ausreißer entfernen, aus numerischen Daten kategoriale Gehaltsstufen bilden und dann mehrere Filterbedingungen kombinieren. Diese Techniken beantworten reale Business-Fragen, die einfache Filter nicht abdecken.

Die Klassen Table, Selection und StringColumn wurden für dich importiert.

Diese Übung ist Teil des Kurses

Daten in Java importieren

Kurs anzeigen

Anleitung zur Übung

  • Entferne Ausreißer (Gehalt < 40.000 \( oder > 250.000 \)).
  • Zähle die nach dem Filtern entfernten Zeilen.
  • Ordne Gehälter den Stufen "Junior", "Mid" und "Senior" zu.
  • Filtere nach den Stufen "Mid"/"Senior" bei Alter unter 30.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

public class DataExploration {
    public static void main(String[] args) {
    
        // Start with the high earners table from previous exercises
        Table employees = Table.read().csv("employees.csv");

        // Remove outliers (salary < $40K or > $250K)
        Selection outliers = employees.intColumn("Salary").isLessThan(____)
            .or(employees.intColumn("Salary").isGreaterThan(____));
        Table cleanedData = employees.____(outliers);
        
        // Count rows removed after filtering
        System.out.println("Employees after removing outliers: " + (employees.____() - cleanedData.____()));
        
        // Map salaries to Junior, Mid, and Senior grades
		StringColumn salaryGroup = cleanedData.intColumn("Salary").map(
    	salary -> {
        	if (salary < 100000) return "____";
        	else if (salary < 200000) return "Mid";
        	else if (salary >= 200000) return "____";
        	else return "Error";
    	},StringColumn::create).setName("SalaryGrade");
        cleanedData = cleanedData.addColumns(salaryGroup);

        // Filter for Mid/Senior grades under age 30
        Selection highPotential = cleanedData.stringColumn("____")
            .isEqualTo("Mid")
            .or(cleanedData.stringColumn("SalaryGrade").isEqualTo("Senior"))
            .and(cleanedData.intColumn("____").isLessThan(30));

        Table highPotentialEmployees = cleanedData.where(____);
        
        System.out.println(highPotentialEmployees.rowCount());
        System.out.println(highPotentialEmployees.first(5));

	}
}
Code bearbeiten und ausführen