ComeçarComece gratuitamente

Definição de índices multiníveis

Também é possível criar índices a partir de várias colunas, formando um índice multinível (às vezes chamado de índice hierárquico). Sua utilização tem prós e contras.

A vantagem é que os índices multiníveis tornam mais natural o raciocínio sobre variáveis categóricas aninhadas. Por exemplo: em um estudo clínico, pode haver grupos de controle e de tratamento. Assim, cada sujeito de teste pertence a um ou outro grupo, e podemos dizer que um sujeito de teste está aninhado no grupo de tratamento. Da mesma forma, no conjunto de dados de temperatura, a cidade está localizada no país, portanto podemos dizer que uma cidade está aninhada no país.

A principal desvantagem é que o código para a manipulação de índices é diferente do código para a manipulação de colunas, portanto é preciso aprender duas sintaxes e acompanhar como os dados são representados.

pandas foi carregado como pd. temperatures já está disponível.

Este exercício faz parte do curso

Manipulação de dados com o pandas

Ver Curso

Instruções de exercício

  • Defina o índice de temperatures como sendo as colunas "country" e "city" e atribua o resultado a temperatures_ind.
  • Especifique dois pares de país/cidade a serem mantidos: "Brazil"/"Rio De Janeiro" e "Pakistan"/"Lahore", atribuindo a rows_to_keep.
  • Imprima e crie o subconjunto de temperatures_ind com as linhas a manter (rows_to_keep) usando .loc[].

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Index temperatures by country & city
temperatures_ind = ____

# List of tuples: Brazil, Rio De Janeiro & Pakistan, Lahore
rows_to_keep = [____]

# Subset for rows to keep
print(temperatures_ind.____)
Editar e executar código