ComenzarEmpieza gratis

Manipular datos de documentos

A lo largo de este capítulo, has explorado una serie de herramientas para trabajar con datos de documentos semiestructurados en Postgres. En este ejercicio final, pondrás en práctica todas estas herramientas para crear un conjunto de datos listo para el análisis. Trabajarás con la tabla nested_reviews, que tiene la forma que se muestra a continuación.

![tablarevisionesanidadas, que muestra datos de muestra.](https://assets.datacamp.com/production/repositories/6394/datasets/a5a5c6c4c7685e62aad0aeb56ccc55b5afaa19ac/Chapter%203.3%20Exercises.png =85%x85%)

Para ayudarte a empezar, se ha importado pandas como pd, y se ha creado un objeto de conexión que se almacena en la variable db_engine. ¡Mucha suerte!

Este ejercicio forma parte del curso

Introducción al NoSQL

Ver curso

Instrucciones del ejercicio

  • Utilizando el operador #> para devolver el campo anidado branch del objeto location en la columna review, como JSON. Alias como branch.
  • Consulta el campo statement en la columna review, utilizando el operador ->>, aliasando el resultado como statement.
  • Filtra los resultados para incluir sólo los registros con una ubicación reviewer de 'Australia', con ayuda de la función json_extract_path_text.

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Extract fields from JSON, and filter by reviewer location
query = """
    SELECT
    	review_id,
        ____ #> '{____, ____}' AS ____,
        ____ ->> '____' AS ____,
        rating
    FROM nested_reviews
    WHERE ____(____, '____', '____') = 'Australia'
    ORDER BY rating DESC;
"""

data = pd.read_sql(query, db_engine)
print(data)
Editar y ejecutar código