ComeçarComece de graça

Extração de dados de documentos

Neste exercício, você praticará o uso das funções json_extract_path e json_extract_path_text para consultar a coluna review da tabela nested_reviews, mostrada abaixo.

![tabela nested_reviews, mostrando dados de amostra](https://assets.datacamp.com/production/repositories/6394/datasets/a5a5c6c4c7685e62aad0aeb56ccc55b5afaa19ac/Chapter%203.3%20Exercises.png =85%x85%)

Um objeto de conexão foi criado e armazenado na variável db_engine, e pandas foi importado como pd. Boa sorte!

Este exercício faz parte do curso

Introdução ao NoSQL

Ver curso

Instruções do exercício

  • Consulte o valor armazenado no campo statement na coluna review da tabela nested_reviews, usando a função json_extract_path.
  • Consulte o campo reviewer aninhado, usando a função json_extract_path_text.
  • Refine sua consulta para incluir apenas os registros em que as informações de branch, extraídas como texto dos dados de JSON, correspondam a 'Disneyland_California'. Use a função apropriada para analisar a estrutura JSON e isolar esse campo específico a ser filtrado.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Return the statement and reviewer fields, filter by the 
# nested branch field
query = """
    SELECT 
        ____(review, '____'),
        ____
    FROM nested_reviews
    WHERE ____(____, '____', '____') = 'Disneyland_California';
"""

data = pd.read_sql(query, db_engine)
print(data)
Editar e executar o código