CommencerCommencer gratuitement

Filtrer sur plusieurs conditions

Jusqu’ici, vous avez importé sélectivement des enregistrements qui satisfaisaient une seule condition, mais il est courant de filtrer des jeux de données selon plusieurs critères. Dans cet exercice, c’est exactement ce que vous allez faire.

La table weather contient les températures maximales et minimales quotidiennes ainsi que les quantités de précipitations pour New York. Concentrons-nous sur le mauvais temps : lorsqu’il est tombé au moins un pouce de neige, ou lorsque la maximale était inférieure ou égale au point de congélation (32° Fahrenheit). Pour cela, vous devez construire une requête qui utilise l’opérateur OR pour examiner les valeurs dans les deux colonnes.

pandas est importé sous le nom pd, et un moteur de base de données, engine, a été créé.

Cet exercice fait partie du cours

Ingestion de données simplifiée avec pandas

Afficher le cours

Instructions

  • Créez une requête qui sélectionne les enregistrements de weathertmax est inférieur ou égal à 32 degrés OR snow est supérieur ou égal à 1 pouce.
  • Utilisez read_sql() pour interroger la base et affectez le résultat à la variable wintry_days.
  • Affichez des statistiques récapitulatives avec la méthode describe() pour vérifier que tous les enregistrements du dataframe respectent les critères donnés.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create query for records with max temps <= 32 or snow >= 1
query = """
SELECT *
  FROM weather
  ____ ____
  ____ ____;
"""

# Query database and assign result to wintry_days
wintry_days = pd.read_sql(____)

# View summary stats about the temperatures
print(____)
Modifier et exécuter le code