In Gruppen zählen
In früheren Übungen hast du Daten aus Tabellen abgerufen und die resultierenden DataFrames in pandas zusammengefasst, um Grafiken zu erstellen. Mit COUNT und GROUP BY in einer SQL-Abfrage können wir diese Kennzahlen direkt aus der Datenbank ziehen.
Die Tabelle hpd311calls hat eine Spalte complaint_type, die Anrufe nach Problemart kategorisiert, zum Beispiel Heizung oder Sanitär. Um Anrufvolumina nach Problemart zu visualisieren, schreibst du eine SQL-Abfrage, die Datensätze nach Beschwerdetyp COUNTet.
pandas wurde als pd importiert, und die Datenbank-Engine für data.db wurde als engine erstellt.
Diese Übung ist Teil des Kurses
Vereinfachte Datenaufnahme mit pandas
Anleitung zur Übung
- Erstelle eine SQL-Abfrage, die die Spalte
complaint_typeund die Anzahl aller Datensätze aushpd311callsabruft, gruppiert nachcomplaint_type. - Erstelle mit
read_sql()ein DataFrame der Anrufzahlen nach Problemart,calls_by_issue. - Führe den letzten Codeabschnitt aus, um die Anzahl der Anrufe für jede Wohnungsangelegenheit zu visualisieren.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create query to get call counts by complaint_type
query = """
____ ____,
____(*)
FROM hpd311calls
____ ____;
"""
# Create dataframe of call counts by issue
calls_by_issue = pd.read_sql(____, ____)
# Graph the number of calls for each housing issue
calls_by_issue.plot.barh(x="complaint_type")
plt.show()