Categorieën voor duur toevoegen
Nu je de categorieën en waarden hebt ingesteld die je wilt vastleggen, is het tijd om een nieuwe kolom te bouwen om de frequentie van vluchten per duur te analyseren!
De variabelen flight_categories, short_flights, medium_flights en long_flights die je eerder hebt gemaakt, zijn beschikbaar.
Daarnaast zijn de volgende pakketten geïmporteerd: pandas als pd, numpy als np, seaborn als sns en matplotlib.pyplot als plt.
Deze oefening maakt deel uit van de cursus
Exploratory Data Analysis in Python
Oefeninstructies
- Maak
conditions, een lijst met subsets vanplanes["Duration"]op basis vanshort_flights,medium_flightsenlong_flights. - Maak de kolom
"Duration_Category"door een functie aan te roepen die jeconditions-lijst enflight_categoriesaccepteert, en stel waarden die niet gevonden worden in op"Extreme duration". - Maak een plot die het aantal per categorie laat zien.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create conditions for values in flight_categories to be created
conditions = [
(planes["____"].____.____(____)),
(planes["____"].____.____(____)),
(planes["____"].____.____(____))
]
# Apply the conditions list to the flight_categories
planes["Duration_Category"] = ____.____(____,
____,
default="____")
# Plot the counts of each category
sns.____(data=____, x="____")
plt.show()