Die API-Antwort und Pandas
In dieser Übung lädst du Daten aus einem API-Response-Objekt in ein pandas-DataFrame. Du vergibst verständliche Spaltennamen und wandelst die Werte von Strings in passende Datentypen um.
Nachdem du das DataFrame erstellt hast, führe den Beispielcode aus, um ein Streudiagramm zu erzeugen, das den Zusammenhang zwischen durchschnittlicher Familiengröße und Medianalter in den Vereinigten Staaten visualisiert.
requests und pandas (als pd) sind bereits importiert. Ein Response-Objekt r ist geladen.
Diese Übung ist Teil des Kurses
Analyse von US-Volkszählungsdaten mit Python
Anleitung zur Übung
- Erstelle eine Liste
col_namesmit 4 neuen Spaltennamen:name,median_age,avg_family_sizeundstate. - Erzeuge das DataFrame
statesmit dem DataFrame-Konstruktor. Der Parameter data soll aufr.json()gesetzt werden, aber nutze Slicing, um das erste Element zu überspringen, das die alten Spaltennamen enthält. - Verwende die Methode
astypeauf jeder Spalte, um den richtigen Datentyp zuzuweisen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import seaborn
import seaborn as sns
sns.set()
# Construct the DataFrame
col_names = ____
states = pd.DataFrame(columns = col_names, data = ____)
# Convert each column with numeric data to an appropriate type
states["median_age"] = states["median_age"].____
states["avg_family_size"] = ____
# Scatterplot with regression line
sns.lmplot(x = "avg_family_size", y = "median_age", data = states)
plt.show()