Filtrer sur plusieurs conditions
Jusqu’ici, vous avez importé sélectivement des enregistrements qui satisfaisaient une seule condition, mais il est courant de filtrer des jeux de données selon plusieurs critères. Dans cet exercice, c’est exactement ce que vous allez faire.
La table weather contient les températures maximales et minimales quotidiennes ainsi que les quantités de précipitations pour New York. Concentrons-nous sur le mauvais temps : lorsqu’il est tombé au moins un pouce de neige, ou lorsque la maximale était inférieure ou égale au point de congélation (32° Fahrenheit). Pour cela, vous devez construire une requête qui utilise l’opérateur OR pour examiner les valeurs dans les deux colonnes.
pandas est importé sous le nom pd, et un moteur de base de données, engine, a été créé.
Cet exercice fait partie du cours
Ingestion de données simplifiée avec pandas
Instructions
- Créez une requête qui sélectionne les enregistrements de
weatheroùtmaxest inférieur ou égal à 32 degrésORsnowest supérieur ou égal à 1 pouce. - Utilisez
read_sql()pour interroger la base et affectez le résultat à la variablewintry_days. - Affichez des statistiques récapitulatives avec la méthode
describe()pour vérifier que tous les enregistrements du dataframe respectent les critères donnés.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create query for records with max temps <= 32 or snow >= 1
query = """
SELECT *
FROM weather
____ ____
____ ____;
"""
# Query database and assign result to wintry_days
wintry_days = pd.read_sql(____)
# View summary stats about the temperatures
print(____)