SAS-bestanden importeren
In deze oefening ga je uitzoeken hoe je een SAS-bestand als DataFrame importeert met SAS7BDAT en pandas. Het bestand 'sales.sas7bdat' staat al in je werkmap en zowel pandas als matplotlib.pyplot zijn al geïmporteerd als volgt:
import pandas as pd
import matplotlib.pyplot as plt
De gegevens zijn aangepast van de website van het bachelorstudieboek Principles of Econometrics door Hill, Griffiths en Lim.
Deze oefening maakt deel uit van de cursus
Introductie tot data importeren in Python
Oefeninstructies
- Importeer de module
SAS7BDATuit de bibliotheeksas7bdat. - Gebruik, in de context van het bestand
'sales.sas7bdat', de methode.to_data_frame()op het objectfileom de inhoud te laden in een DataFramedf_sas. - Print de head van het DataFrame
df_sas. - Voer je hele script uit om een histogram te maken!
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import sas7bdat package
from ____ import ____
# Save file to a DataFrame: df_sas
with SAS7BDAT('sales.sas7bdat') as file:
____
# Print head of DataFrame
# Plot histogram of DataFrame features (pandas and pyplot already imported)
pd.DataFrame.hist(df_sas[['P']])
plt.ylabel('count')
plt.show()