Establecer índices multinivel
Los índices también pueden estar formados por varias columnas, formando un índice multinivel (a veces llamado índice jerárquico). Utilizarlos tiene su contrapartida.
La ventaja es que los índices multinivel facilitan la interpretación a partir de variables categóricas anidadas. Por ejemplo, en un ensayo clínico, puedes tener grupos de control y de tratamiento. Entonces, cada sujeto de prueba pertenece a uno u otro grupo, y podemos decir que un sujeto de prueba está anidado dentro del grupo de tratamiento. Del mismo modo, en el conjunto de datos de temperatura, la ciudad está situada en el país, por lo que podemos decir que una ciudad está anidada dentro del país.
El principal inconveniente es que el código para manipular índices es distinto del código para manipular columnas, por lo que tienes que aprender dos sintaxis y estar al tanto de cómo se representan tus datos.
pandas se carga como pd. temperatures está disponible.
Este ejercicio forma parte del curso
Manipulación de datos con pandas
Instrucciones del ejercicio
- Establece el índice de
temperaturesen las columnas"country"y"city", y asígnalo atemperatures_ind. - Especifica dos pares país/ciudad a conservar:
"Brazil"/"Rio De Janeiro"y"Pakistan"/"Lahore", asignando arows_to_keep. - Imprime y subconjunta
temperatures_indpararows_to_keeputilizando.loc[].
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Index temperatures by country & city
temperatures_ind = ____
# List of tuples: Brazil, Rio De Janeiro & Pakistan, Lahore
rows_to_keep = [____]
# Subset for rows to keep
print(temperatures_ind.____)