Aan de slagGa gratis aan de slag

De API-respons en Pandas

In deze oefening laad je gegevens uit een API-responsobject in een pandas DataFrame. Je geeft gebruiksvriendelijke kolomnamen en zet de waarden om van strings naar passende datatypes.

Nadat je het DataFrame hebt gemaakt, voer je de voorbeeldcode uit om een scatterplot te maken die de relatie tussen de gemiddelde gezinsgrootte en de mediane leeftijd in de Verenigde Staten visualiseert.

requests en pandas (als pd) zijn al geïmporteerd. Een responsobject r is geladen.

Deze oefening maakt deel uit van de cursus

US Census-gegevens analyseren in Python

Cursus bekijken

Oefeninstructies

  • Maak een lijst col_names met 4 nieuwe kolomnamen: name, median_age, avg_family_size en state
  • Gebruik de DataFrame-constructor om het DataFrame states te maken. De data-parameter moet worden ingesteld op r.json(), maar gebruik slicing om het eerste item over te slaan, dat de oude kolomnamen bevat
  • Gebruik de methode astype op elke kolom om het juiste datatype toe te kennen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import seaborn
import seaborn as sns
sns.set()

# Construct the DataFrame
col_names = ____
states = pd.DataFrame(columns = col_names, data = ____)

# Convert each column with numeric data to an appropriate type
states["median_age"] = states["median_age"].____
states["avg_family_size"] = ____

# Scatterplot with regression line
sns.lmplot(x = "avg_family_size", y = "median_age", data = states)
plt.show()
Code bewerken en uitvoeren