Sélectionner des lignes
Les clauses WHERE en SQL renvoient les enregistrements dont les valeurs répondent aux critères spécifiés. Passer une telle requête à read_sql() produit un dataframe ne contenant que les enregistrements qui nous intéressent, ce qui réduit le filtrage à faire par la suite.
La table hpd311calls dans data.db contient des données sur des appels concernant divers problèmes de logement, des soucis de maintenance aux demandes d’information. Dans cet exercice, vous allez utiliser SQL pour vous concentrer sur les appels liés à la sécurité.
pandas a été importé sous le nom pd, et un moteur de base de données, engine, a été créé pour data.db.
Cet exercice fait partie du cours
Ingestion de données simplifiée avec pandas
Instructions
- Créez une requête qui sélectionne toutes les colonnes des enregistrements de
hpd311callsdontcomplaint_typevaut'SAFETY'. - Utilisez
read_sql()pour interroger la base et affectez le résultat à la variablesafety_calls. - Exécutez la dernière section de code pour créer un graphique du nombre d’appels liés à la sécurité dans chaque arrondissement.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create query to get hpd311calls records about safety
query = """
____ *
____ hpd311calls
____ ____;
"""
# Query the database and assign result to safety_calls
safety_calls = ____
# Graph the number of safety calls by borough
call_counts = safety_calls.groupby('borough').unique_key.count()
call_counts.plot.barh()
plt.show()