Aan de slagGa gratis aan de slag

Niet-platte bestanden van het web importeren

Gefeliciteerd! Je hebt zojuist een flat file van het web in een DataFrame geladen zonder het eerst lokaal op te slaan met de pandas-functie pd.read_csv(). Deze functie is superhandig, want er zijn nauw verwante functies waarmee je allerlei soorten bestanden kunt laden, niet alleen platte bestanden. In deze interactieve oefening gebruik je pd.read_excel() om een Excel-spreadsheet te importeren.

De URL van de spreadsheet is

'https://assets.datacamp.com/course/importing_data_into_r/latitude.xls'

Jouw taak is om pd.read_excel() te gebruiken om alle werkbladen in te lezen, de werkbladnamen af te drukken en vervolgens de head van het eerste werkblad af te drukken met de naam, niet de index.

Merk op dat de output van pd.read_excel() een Python-dictionary is met werkbladnamen als keys en de bijbehorende DataFrames als bijbehorende waarden.

Deze oefening maakt deel uit van de cursus

Gevorderd data importeren in Python

Cursus bekijken

Oefeninstructies

  • Wijs de URL van het bestand toe aan de variabele url.
  • Lees het bestand op url in een dictionary xls met pd.read_excel(). Denk eraan: om alle werkbladen te importeren, geef je None door aan het argument sheet_name.
  • Print de namen van de werkbladen in de Excel-spreadsheet; dit zijn de keys van de dictionary xls.
  • Print de head van het eerste werkblad met de werkbladnaam, niet met de index van het werkblad! De werkbladnaam is '1700'

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import package
import pandas as pd

# Assign url of file: url


# Read in all sheets of Excel file: xls


# Print the sheetnames to the shell


# Print the head of the first sheet (using its name, NOT its index)

Code bewerken en uitvoeren