Fortgeschrittenes Filtern und Analysen
TechCorp möchte High-Potentials für ein Leadership-Programm identifizieren: junge Mitarbeitende (unter 30), die bereits Mid- oder Senior-Gehälter verdienen. Dazu musst du Ausreißer entfernen, aus numerischen Daten kategoriale Gehaltsstufen bilden und dann mehrere Filterbedingungen kombinieren. Diese Techniken beantworten reale Business-Fragen, die einfache Filter nicht abdecken.
Die Klassen Table, Selection und StringColumn wurden für dich importiert.
Diese Übung ist Teil des Kurses
Daten in Java importieren
Anleitung zur Übung
- Entferne Ausreißer (Gehalt < 40.000 \( oder > 250.000 \)).
- Zähle die nach dem Filtern entfernten Zeilen.
- Ordne Gehälter den Stufen
"Junior","Mid"und"Senior"zu. - Filtere nach den Stufen
"Mid"/"Senior"bei Alter unter 30.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
public class DataExploration {
public static void main(String[] args) {
// Start with the high earners table from previous exercises
Table employees = Table.read().csv("employees.csv");
// Remove outliers (salary < $40K or > $250K)
Selection outliers = employees.intColumn("Salary").isLessThan(____)
.or(employees.intColumn("Salary").isGreaterThan(____));
Table cleanedData = employees.____(outliers);
// Count rows removed after filtering
System.out.println("Employees after removing outliers: " + (employees.____() - cleanedData.____()));
// Map salaries to Junior, Mid, and Senior grades
StringColumn salaryGroup = cleanedData.intColumn("Salary").map(
salary -> {
if (salary < 100000) return "____";
else if (salary < 200000) return "Mid";
else if (salary >= 200000) return "____";
else return "Error";
},StringColumn::create).setName("SalaryGrade");
cleanedData = cleanedData.addColumns(salaryGroup);
// Filter for Mid/Senior grades under age 30
Selection highPotential = cleanedData.stringColumn("____")
.isEqualTo("Mid")
.or(cleanedData.stringColumn("SalaryGrade").isEqualTo("Senior"))
.and(cleanedData.intColumn("____").isLessThan(30));
Table highPotentialEmployees = cleanedData.where(____);
System.out.println(highPotentialEmployees.rowCount());
System.out.println(highPotentialEmployees.first(5));
}
}