Die API-Antwort und Pandas

In dieser Übung lädst du Daten aus einem API-Response-Objekt in ein pandas-DataFrame. Du vergibst verständliche Spaltennamen und wandelst die Werte von Strings in passende Datentypen um.

Nachdem du das DataFrame erstellt hast, führe den Beispielcode aus, um ein Streudiagramm zu erzeugen, das den Zusammenhang zwischen durchschnittlicher Familiengröße und Medianalter in den Vereinigten Staaten visualisiert.

requests und pandas (als pd) sind bereits importiert. Ein Response-Objekt r ist geladen.

Diese Übung ist Teil des Kurses

<Kurs>Analyse von US-Volkszählungsdaten mit Python</Kurs>

Kurs ansehen

Übungsanweisungen

Erstelle eine Liste col_names mit 4 neuen Spaltennamen: name, median_age, avg_family_size und state.
Erzeuge das DataFrame states mit dem DataFrame-Konstruktor. Der Parameter data soll auf r.json() gesetzt werden, aber nutze Slicing, um das erste Element zu überspringen, das die alten Spaltennamen enthält.
Verwende die Methode astype auf jeder Spalte, um den richtigen Datentyp zuzuweisen.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import seaborn
import seaborn as sns
sns.set()

# Construct the DataFrame
col_names = ____
states = pd.DataFrame(columns = col_names, data = ____)

# Convert each column with numeric data to an appropriate type
states["median_age"] = states["median_age"].____
states["avg_family_size"] = ____

# Scatterplot with regression line
sns.lmplot(x = "avg_family_size", y = "median_age", data = states)
plt.show()

Code bearbeiten und ausführen