Filtraggio avanzato e analisi
TechCorp vuole individuare i dipendenti ad alto potenziale per percorsi di leadership: giovani (under 30) che già percepiscono stipendi di livello Mid o Senior. Questo richiede di rimuovere gli outlier, creare classi salariali categoriali a partire da dati numerici e poi combinare più condizioni di filtro. Queste tecniche rispondono a esigenze reali di business che i filtri semplici non riescono a gestire.
Le classi Table, Selection e StringColumn sono già state importate per te.
Questo esercizio fa parte del corso
Importare dati in Java
Istruzioni dell'esercizio
- Rimuovi gli outlier (stipendio < $40K o > $250K).
- Conta le righe rimosse dopo il filtraggio.
- Mappa gli stipendi nelle classi
"Junior","Mid"e"Senior". - Filtra per classi
"Mid"/"Senior"con età inferiore a 30 anni.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
public class DataExploration {
public static void main(String[] args) {
// Start with the high earners table from previous exercises
Table employees = Table.read().csv("employees.csv");
// Remove outliers (salary < $40K or > $250K)
Selection outliers = employees.intColumn("Salary").isLessThan(____)
.or(employees.intColumn("Salary").isGreaterThan(____));
Table cleanedData = employees.____(outliers);
// Count rows removed after filtering
System.out.println("Employees after removing outliers: " + (employees.____() - cleanedData.____()));
// Map salaries to Junior, Mid, and Senior grades
StringColumn salaryGroup = cleanedData.intColumn("Salary").map(
salary -> {
if (salary < 100000) return "____";
else if (salary < 200000) return "Mid";
else if (salary >= 200000) return "____";
else return "Error";
},StringColumn::create).setName("SalaryGrade");
cleanedData = cleanedData.addColumns(salaryGroup);
// Filter for Mid/Senior grades under age 30
Selection highPotential = cleanedData.stringColumn("____")
.isEqualTo("Mid")
.or(cleanedData.stringColumn("SalaryGrade").isEqualTo("Senior"))
.and(cleanedData.intColumn("____").isLessThan(30));
Table highPotentialEmployees = cleanedData.where(____);
System.out.println(highPotentialEmployees.rowCount());
System.out.println(highPotentialEmployees.first(5));
}
}