Establecer índices multinivel
Los índices también pueden estar formados por varias columnas, formando un índice multinivel (a veces llamado índice jerárquico). Utilizarlos tiene su contrapartida.
La ventaja es que los índices multinivel hacen más natural razonar sobre variables categóricas anidadas. Por ejemplo, en un ensayo clínico, puedes tener grupos de control y de tratamiento. Entonces, cada sujeto de prueba pertenece a uno u otro grupo, y podemos decir que un sujeto de prueba está anidado dentro del grupo de tratamiento. Del mismo modo, en el conjunto de datos de temperatura, la ciudad está situada en el país, por lo que podemos decir que una ciudad está anidada dentro del país.
El principal inconveniente es que el código para manipular índices es distinto del código para manipular columnas, por lo que tienes que aprender dos sintaxis y estar al tanto de cómo se representan tus datos.
pandas
se carga como pd
. temperatures
está disponible.
Este ejercicio forma parte del curso
Manipulación de datos con pandas
Instrucciones de ejercicio
- Establece el índice de
temperatures
en las columnas"country"
y"city"
, y asígnalo atemperatures_ind
. - Especifica dos pares país/ciudad a conservar:
"Brazil"
/"Rio De Janeiro"
y"Pakistan"
/"Lahore"
, asignando arows_to_keep
. - Imprime y subconjunta
temperatures_ind
pararows_to_keep
utilizando.loc[]
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Index temperatures by country & city
temperatures_ind = ____
# List of tuples: Brazil, Rio De Janeiro & Pakistan, Lahore
rows_to_keep = [____]
# Subset for rows to keep
print(temperatures_ind.____)