De API-respons en Pandas
In deze oefening laad je gegevens uit een API-responsobject in een pandas DataFrame. Je geeft gebruiksvriendelijke kolomnamen en zet de waarden om van strings naar passende datatypes.
Nadat je het DataFrame hebt gemaakt, voer je de voorbeeldcode uit om een scatterplot te maken die de relatie tussen de gemiddelde gezinsgrootte en de mediane leeftijd in de Verenigde Staten visualiseert.
requests en pandas (als pd) zijn al geïmporteerd. Een responsobject r is geladen.
Deze oefening maakt deel uit van de cursus
US Census-gegevens analyseren in Python
Oefeninstructies
- Maak een lijst
col_namesmet 4 nieuwe kolomnamen:name,median_age,avg_family_sizeenstate - Gebruik de DataFrame-constructor om het DataFrame
stateste maken. De data-parameter moet worden ingesteld opr.json(), maar gebruik slicing om het eerste item over te slaan, dat de oude kolomnamen bevat - Gebruik de methode
astypeop elke kolom om het juiste datatype toe te kennen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import seaborn
import seaborn as sns
sns.set()
# Construct the DataFrame
col_names = ____
states = pd.DataFrame(columns = col_names, data = ____)
# Convert each column with numeric data to an appropriate type
states["median_age"] = states["median_age"].____
states["avg_family_size"] = ____
# Scatterplot with regression line
sns.lmplot(x = "avg_family_size", y = "median_age", data = states)
plt.show()