LoslegenKostenlos loslegen

Dokumentdaten extrahieren

In dieser Übung übst du, wie du die Funktionen json_extract_path und json_extract_path_text verwendest, um die Spalte review der Tabelle nested_reviews abzufragen, die unten gezeigt ist.

nested_reviews table, showing sample data.

Ein Connection-Objekt wurde erstellt und in der Variable db_engine gespeichert, und pandas wurde als pd importiert. Viel Erfolg!

Diese Übung ist Teil des Kurses

Einführung in NoSQL

Kurs anzeigen

Anleitung zur Übung

  • Frage den Wert ab, der im Feld statement in der Spalte review der Tabelle nested_reviews gespeichert ist, und verwende dafür die Funktion json_extract_path.
  • Frage das verschachtelte Feld reviewer mit der Funktion json_extract_path_text ab.
  • Verfeinere deine Abfrage so, dass nur Datensätze enthalten sind, bei denen die als Text aus den JSON-Daten extrahierte branch-Information 'Disneyland_California' entspricht. Verwende die passende Funktion, um die JSON-Struktur zu durchlaufen und genau dieses Feld für den Filter zu isolieren.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Return the statement and reviewer fields, filter by the 
# nested branch field
query = """
    SELECT 
        ____(review, '____'),
        ____
    FROM nested_reviews
    WHERE ____(____, '____', '____') = 'Disneyland_California';
"""

data = pd.read_sql(query, db_engine)
print(data)
Code bearbeiten und ausführen