IniziaInizia gratis

Filtraggio avanzato e analisi

TechCorp vuole individuare i dipendenti ad alto potenziale per percorsi di leadership: giovani (under 30) che già percepiscono stipendi di livello Mid o Senior. Questo richiede di rimuovere gli outlier, creare classi salariali categoriali a partire da dati numerici e poi combinare più condizioni di filtro. Queste tecniche rispondono a esigenze reali di business che i filtri semplici non riescono a gestire.

Le classi Table, Selection e StringColumn sono già state importate per te.

Questo esercizio fa parte del corso

Importare dati in Java

Visualizza il corso

Istruzioni dell'esercizio

  • Rimuovi gli outlier (stipendio < $40K o > $250K).
  • Conta le righe rimosse dopo il filtraggio.
  • Mappa gli stipendi nelle classi "Junior", "Mid" e "Senior".
  • Filtra per classi "Mid"/"Senior" con età inferiore a 30 anni.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

public class DataExploration {
    public static void main(String[] args) {
    
        // Start with the high earners table from previous exercises
        Table employees = Table.read().csv("employees.csv");

        // Remove outliers (salary < $40K or > $250K)
        Selection outliers = employees.intColumn("Salary").isLessThan(____)
            .or(employees.intColumn("Salary").isGreaterThan(____));
        Table cleanedData = employees.____(outliers);
        
        // Count rows removed after filtering
        System.out.println("Employees after removing outliers: " + (employees.____() - cleanedData.____()));
        
        // Map salaries to Junior, Mid, and Senior grades
		StringColumn salaryGroup = cleanedData.intColumn("Salary").map(
    	salary -> {
        	if (salary < 100000) return "____";
        	else if (salary < 200000) return "Mid";
        	else if (salary >= 200000) return "____";
        	else return "Error";
    	},StringColumn::create).setName("SalaryGrade");
        cleanedData = cleanedData.addColumns(salaryGroup);

        // Filter for Mid/Senior grades under age 30
        Selection highPotential = cleanedData.stringColumn("____")
            .isEqualTo("Mid")
            .or(cleanedData.stringColumn("SalaryGrade").isEqualTo("Senior"))
            .and(cleanedData.intColumn("____").isLessThan(30));

        Table highPotentialEmployees = cleanedData.where(____);
        
        System.out.println(highPotentialEmployees.rowCount());
        System.out.println(highPotentialEmployees.first(5));

	}
}
Modifica ed esegui il codice