CommencerCommencer gratuitement

Trouver la cohérence

Dans cet exercice et tout au long de ce chapitre, vous travaillerez avec le DataFrame airlines, qui contient les réponses à une enquête menée auprès des clients des compagnies aériennes sur l'aéroport de San Francisco.

Le DataFrame contient des métadonnées sur les vols, telles que la compagnie aérienne, la destination, les temps d'attente, ainsi que les réponses à des questions clés concernant la propreté, la sécurité et la satisfaction. Un autre DataFrame nommé « categories » a été créé, contenant toutes les valeurs correctes possibles pour les colonnes de l'enquête.

Dans cet exercice, vous utiliserez ces deux DataFrames pour identifier les réponses au sondage présentant des valeurs incohérentes et les supprimer, en effectuant efficacement une jointure externe et interne sur ces deux DataFrames, comme illustré dans l'exercice vidéo. Le package pandas a été importé sous le nom pd, et les DataFrames airlines et categories sont disponibles dans votre environnement.

Cet exercice fait partie du cours

Nettoyage des données en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Print categories DataFrame
print(____)

# Print unique values of survey columns in airlines
print('Cleanliness: ', airlines['cleanliness'].____, "\n")
print('Safety: ', ____, "\n")
print('Satisfaction: ', ____, "\n")
Modifier et exécuter le code