ComeçarComece de graça

Filtragem avançada e análise

A TechCorp quer identificar funcionários de alto potencial para programas de liderança: pessoas jovens (menos de 30 anos) que já recebem salários de nível Mid ou Senior. Isso exige remover outliers, criar faixas salariais categóricas a partir de dados numéricos e combinar múltiplas condições de filtro. Essas técnicas ajudam a responder perguntas de negócio reais que filtros simples não conseguem resolver.

As classes Table, Selection e StringColumn já foram importadas para você.

Este exercício faz parte do curso

Importando dados em Java

Ver curso

Instruções do exercício

  • Remova outliers (salário < US\( 40 mil ou > US\) 250 mil).
  • Conte as linhas removidas após a filtragem.
  • Faça o mapeamento de salários para os níveis "Junior", "Mid" e "Senior".
  • Filtre pelos níveis "Mid"/"Senior" para idades abaixo de 30.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

public class DataExploration {
    public static void main(String[] args) {
    
        // Start with the high earners table from previous exercises
        Table employees = Table.read().csv("employees.csv");

        // Remove outliers (salary < $40K or > $250K)
        Selection outliers = employees.intColumn("Salary").isLessThan(____)
            .or(employees.intColumn("Salary").isGreaterThan(____));
        Table cleanedData = employees.____(outliers);
        
        // Count rows removed after filtering
        System.out.println("Employees after removing outliers: " + (employees.____() - cleanedData.____()));
        
        // Map salaries to Junior, Mid, and Senior grades
		StringColumn salaryGroup = cleanedData.intColumn("Salary").map(
    	salary -> {
        	if (salary < 100000) return "____";
        	else if (salary < 200000) return "Mid";
        	else if (salary >= 200000) return "____";
        	else return "Error";
    	},StringColumn::create).setName("SalaryGrade");
        cleanedData = cleanedData.addColumns(salaryGroup);

        // Filter for Mid/Senior grades under age 30
        Selection highPotential = cleanedData.stringColumn("____")
            .isEqualTo("Mid")
            .or(cleanedData.stringColumn("SalaryGrade").isEqualTo("Senior"))
            .and(cleanedData.intColumn("____").isLessThan(30));

        Table highPotentialEmployees = cleanedData.where(____);
        
        System.out.println(highPotentialEmployees.rowCount());
        System.out.println(highPotentialEmployees.first(5));

	}
}
Editar e executar o código