Definição de índices multiníveis
Também é possível criar índices a partir de várias colunas, formando um índice multinível (às vezes chamado de índice hierárquico). Sua utilização tem prós e contras.
A vantagem é que os índices multiníveis tornam mais natural o raciocínio sobre variáveis categóricas aninhadas. Por exemplo: em um estudo clínico, pode haver grupos de controle e de tratamento. Assim, cada sujeito de teste pertence a um ou outro grupo, e podemos dizer que um sujeito de teste está aninhado no grupo de tratamento. Da mesma forma, no conjunto de dados de temperatura, a cidade está localizada no país, portanto podemos dizer que uma cidade está aninhada no país.
A principal desvantagem é que o código para a manipulação de índices é diferente do código para a manipulação de colunas, portanto é preciso aprender duas sintaxes e acompanhar como os dados são representados.
pandas
foi carregado como pd
. temperatures
já está disponível.
Este exercício faz parte do curso
Manipulação de dados com o pandas
Instruções de exercício
- Defina o índice de
temperatures
como sendo as colunas"country"
e"city"
e atribua o resultado atemperatures_ind
. - Especifique dois pares de país/cidade a serem mantidos:
"Brazil"
/"Rio De Janeiro"
e"Pakistan"
/"Lahore"
, atribuindo arows_to_keep
. - Imprima e crie o subconjunto de
temperatures_ind
com as linhas a manter (rows_to_keep
) usando.loc[]
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Index temperatures by country & city
temperatures_ind = ____
# List of tuples: Brazil, Rio De Janeiro & Pakistan, Lahore
rows_to_keep = [____]
# Subset for rows to keep
print(temperatures_ind.____)