Strategieën voor resterende missende data
De vijfprocentsregel heeft goed gewerkt voor je planes-gegevensset: missende waarden zijn verwijderd uit negen van de 11 kolommen!
Nu moet je beslissen wat je doet met de kolommen "Additional_Info" en "Price", waarin respectievelijk 300 en 368 waarden ontbreken.
Je bekijkt eerst wat er in "Additional_Info" staat en visualiseert daarna de prijs van vliegtickets per luchtvaartmaatschappij.
De volgende imports zijn alvast voor je gedaan:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
Deze oefening maakt deel uit van de cursus
Exploratory Data Analysis in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Check the values of the Additional_Info column
print(____)