Ajouter des catégories de durée
Maintenant que vous avez défini les catégories et les valeurs que vous souhaitez capturer, il est temps de créer une nouvelle colonne pour analyser la fréquence des vols par durée.
Les variables flight_categories
, short_flights
, medium_flights
, et long_flights
que vous avez créées précédemment sont à votre disposition.
En outre, les paquets suivants ont été importés : pandas
en tant que pd
, numpy
en tant que np
, seaborn
en tant que sns
, et matplotlib.pyplot
en tant que plt
.
Cet exercice fait partie du cours
Analyse de données exploratoires en Python
Instructions
- Créez
conditions
, une liste contenant des sous-ensembles deplanes["Duration"]
basés surshort_flights
,medium_flights
etlong_flights
. - Créez la colonne
"Duration_Category"
en appelant une fonction qui accepte votre listeconditions
etflight_categories
, en fixant les valeurs non trouvées à"Extreme duration"
. - Créez un graphique montrant le nombre de vols dans chaque catégorie.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create conditions for values in flight_categories to be created
conditions = [
(planes["____"].____.____(____)),
(planes["____"].____.____(____)),
(planes["____"].____.____(____))
]
# Apply the conditions list to the flight_categories
planes["Duration_Category"] = ____.____(____,
____,
default="____")
# Plot the counts of each category
sns.____(data=____, x="____")
plt.show()