Aan de slagGa gratis aan de slag

SAS-bestanden importeren

In deze oefening ga je uitzoeken hoe je een SAS-bestand als DataFrame importeert met SAS7BDAT en pandas. Het bestand 'sales.sas7bdat' staat al in je werkmap en zowel pandas als matplotlib.pyplot zijn al geïmporteerd als volgt:

import pandas as pd
import matplotlib.pyplot as plt

De gegevens zijn aangepast van de website van het bachelorstudieboek Principles of Econometrics door Hill, Griffiths en Lim.

Deze oefening maakt deel uit van de cursus

Introductie tot data importeren in Python

Cursus bekijken

Oefeninstructies

  • Importeer de module SAS7BDAT uit de bibliotheek sas7bdat.
  • Gebruik, in de context van het bestand 'sales.sas7bdat', de methode .to_data_frame() op het object file om de inhoud te laden in een DataFrame df_sas.
  • Print de head van het DataFrame df_sas.
  • Voer je hele script uit om een histogram te maken!

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import sas7bdat package
from ____ import ____

# Save file to a DataFrame: df_sas
with SAS7BDAT('sales.sas7bdat') as file:
    ____

# Print head of DataFrame


# Plot histogram of DataFrame features (pandas and pyplot already imported)
pd.DataFrame.hist(df_sas[['P']])
plt.ylabel('count')
plt.show()
Code bewerken en uitvoeren