Exploration initiale des données
Vous venez d’arriver comme data analyst chez TechCorp. Les RH ont besoin d’une vue ciblée des hauts salaires pour la planification budgétaire, mais la table complète des employés comporte des dizaines de colonnes. Ne retenir que les colonnes pertinentes réduit le bruit et rend votre analyse plus claire pour vous et pour les parties prenantes qui la consulteront.
Les classes Table et associées de Tablesaw ont été importées pour vous.
Cet exercice fait partie du cours
Importer des données en Java
Instructions
- Sélectionnez les colonnes :
"Name","Department","JobTitle","Salary","Age". - Filtrez les salaires supérieurs à 60 000 $.
- Triez par salaire décroissant.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
public class DataExploration {
public static void main(String[] args) {
try {
Table employees = Table.read().csv("employees.csv");
// Select the essential columns
Table essentialData = employees.____("Name", "Department", "JobTitle", "Salary", "Age");
// Filter for salaries above $60,000
Table highEarners = essentialData.____(
essentialData.intColumn("____").____(60000));
// Sort by salary descending
Table sortedHighEarners = highEarners.____("____");
System.out.println("Top 10 Highest Earning Employees:");
System.out.println(sortedHighEarners.first(10));
} catch (Exception e) {
System.err.println("Error reading CSV files: " + e.getMessage());
}
}
}