CommencerCommencer gratuitement

Extraire des données de document

Dans cet exercice, vous allez vous entraîner à utiliser les fonctions json_extract_path et json_extract_path_text pour interroger la colonne review de la table nested_reviews, illustrée ci-dessous.

nested_reviews table, showing sample data.

Un objet de connexion a été créé et stocké dans la variable db_engine, et pandas a été importé sous l’alias pd. Bonne chance !

Cet exercice fait partie du cours

Introduction à NoSQL

Afficher le cours

Instructions

  • Interrogez la valeur stockée dans le champ statement de la colonne review de la table nested_reviews, en utilisant la fonction json_extract_path.
  • Interrogez le champ imbriqué reviewer, en utilisant la fonction json_extract_path_text.
  • Affinez votre requête pour ne conserver que les enregistrements où l’information branch, extraite en tant que texte des données JSON, correspond à 'Disneyland_California'. Utilisez la fonction appropriée pour parcourir la structure JSON et isoler ce champ précis à filtrer.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Return the statement and reviewer fields, filter by the 
# nested branch field
query = """
    SELECT 
        ____(review, '____'),
        ____
    FROM nested_reviews
    WHERE ____(____, '____', '____') = 'Disneyland_California';
"""

data = pd.read_sql(query, db_engine)
print(data)
Modifier et exécuter le code