Filtragem avançada e análise
A TechCorp quer identificar funcionários de alto potencial para programas de liderança: pessoas jovens (menos de 30 anos) que já recebem salários de nível Mid ou Senior. Isso exige remover outliers, criar faixas salariais categóricas a partir de dados numéricos e combinar múltiplas condições de filtro. Essas técnicas ajudam a responder perguntas de negócio reais que filtros simples não conseguem resolver.
As classes Table, Selection e StringColumn já foram importadas para você.
Este exercício faz parte do curso
Importando dados em Java
Instruções do exercício
- Remova outliers (salário < US\( 40 mil ou > US\) 250 mil).
- Conte as linhas removidas após a filtragem.
- Faça o mapeamento de salários para os níveis
"Junior","Mid"e"Senior". - Filtre pelos níveis
"Mid"/"Senior"para idades abaixo de 30.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
public class DataExploration {
public static void main(String[] args) {
// Start with the high earners table from previous exercises
Table employees = Table.read().csv("employees.csv");
// Remove outliers (salary < $40K or > $250K)
Selection outliers = employees.intColumn("Salary").isLessThan(____)
.or(employees.intColumn("Salary").isGreaterThan(____));
Table cleanedData = employees.____(outliers);
// Count rows removed after filtering
System.out.println("Employees after removing outliers: " + (employees.____() - cleanedData.____()));
// Map salaries to Junior, Mid, and Senior grades
StringColumn salaryGroup = cleanedData.intColumn("Salary").map(
salary -> {
if (salary < 100000) return "____";
else if (salary < 200000) return "Mid";
else if (salary >= 200000) return "____";
else return "Error";
},StringColumn::create).setName("SalaryGrade");
cleanedData = cleanedData.addColumns(salaryGroup);
// Filter for Mid/Senior grades under age 30
Selection highPotential = cleanedData.stringColumn("____")
.isEqualTo("Mid")
.or(cleanedData.stringColumn("SalaryGrade").isEqualTo("Senior"))
.and(cleanedData.intColumn("____").isLessThan(30));
Table highPotentialEmployees = cleanedData.where(____);
System.out.println(highPotentialEmployees.rowCount());
System.out.println(highPotentialEmployees.first(5));
}
}