In Gruppen zählen

In früheren Übungen hast du Daten aus Tabellen abgerufen und die resultierenden DataFrames in pandas zusammengefasst, um Grafiken zu erstellen. Mit COUNT und GROUP BY in einer SQL-Abfrage können wir diese Kennzahlen direkt aus der Datenbank ziehen.

Die Tabelle hpd311calls hat eine Spalte complaint_type, die Anrufe nach Problemart kategorisiert, zum Beispiel Heizung oder Sanitär. Um Anrufvolumina nach Problemart zu visualisieren, schreibst du eine SQL-Abfrage, die Datensätze nach Beschwerdetyp COUNTet.

pandas wurde als pd importiert, und die Datenbank-Engine für data.db wurde als engine erstellt.

Diese Übung ist Teil des Kurses

<Kurs>Vereinfachte Datenaufnahme mit pandas</Kurs>

Kurs ansehen

Übungsanweisungen

Erstelle eine SQL-Abfrage, die die Spalte complaint_type und die Anzahl aller Datensätze aus hpd311calls abruft, gruppiert nach complaint_type.
Erstelle mit read_sql() ein DataFrame der Anrufzahlen nach Problemart, calls_by_issue.
Führe den letzten Codeabschnitt aus, um die Anzahl der Anrufe für jede Wohnungsangelegenheit zu visualisieren.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create query to get call counts by complaint_type
query = """
____ ____, 
     ____(*)
  FROM hpd311calls
  ____ ____;
"""

# Create dataframe of call counts by issue
calls_by_issue = pd.read_sql(____, ____)

# Graph the number of calls for each housing issue
calls_by_issue.plot.barh(x="complaint_type")
plt.show()

Code bearbeiten und ausführen