Een CSV-bestand aanpassen
Soms moet je gegevens op een aangepaste manier opslaan in een CSV-bestand. Denk aan andere kopwaarden gebruiken, de indexkolom van een DataFrame wel of niet opnemen, of het scheidingsteken tussen kolommen aanpassen. In dit voorbeeld ga je hiermee oefenen en zorg je er ook voor dat het bestand op het gewenste bestandspad wordt opgeslagen.
De bibliotheek pandas is geïmporteerd als pd, en de gegevens zijn al getransformeerd zodat alleen rijen met een "Quantity Ordered" groter dan één overblijven. Het opgeschoonde DataFrame is opgeslagen in een variabele met de naam clean_sales_data.
Deze oefening maakt deel uit van de cursus
ETL en ELT in Python
Oefeninstructies
- Importeer de bibliotheek
os. - Schrijf het opgeschoonde DataFrame weg naar een CSV op
path_to_write, zonder header. - Controleer dat het bestand op het gewenste pad is weggeschreven.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the os library
____
# Load the data to a csv file with the index, no header and pipe separated
def load(clean_data, path_to_write):
clean_data.____(____, header=____, sep="|")
load(clean_sales_data, "clean_sales_data.csv")
# Check that the file is present.
file_exists = os.____.____(____)
print(file_exists)