Definição de índices multiníveis
Também é possível criar índices a partir de várias colunas, formando um índice multinível (às vezes chamado de índice hierárquico). Sua utilização tem prós e contras.
A vantagem é que os índices multiníveis tornam mais natural o raciocínio sobre variáveis categóricas aninhadas. Por exemplo: em um estudo clínico, pode haver grupos de controle e de tratamento. Assim, cada sujeito de teste pertence a um ou outro grupo, e podemos dizer que um sujeito de teste está aninhado no grupo de tratamento. Da mesma forma, no conjunto de dados de temperatura, a cidade está localizada no país, portanto podemos dizer que uma cidade está aninhada no país.
A principal desvantagem é que o código para a manipulação de índices é diferente do código para a manipulação de colunas, portanto é preciso aprender duas sintaxes e acompanhar como os dados são representados.
pandas foi carregado como pd. temperatures já está disponível.
Este exercício faz parte do curso
Manipulação de dados com o pandas
Instruções do exercício
- Defina o índice de
temperaturescomo sendo as colunas"country"e"city"e atribua o resultado atemperatures_ind. - Especifique dois pares de país/cidade a serem mantidos:
"Brazil"/"Rio De Janeiro"e"Pakistan"/"Lahore", atribuindo arows_to_keep. - Imprima e crie o subconjunto de
temperatures_indcom as linhas a manter (rows_to_keep) usando.loc[].
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Index temperatures by country & city
temperatures_ind = ____
# List of tuples: Brazil, Rio De Janeiro & Pakistan, Lahore
rows_to_keep = [____]
# Subset for rows to keep
print(temperatures_ind.____)