Unirlo todo (1)
Ya has probado a escribir tus propias funciones en los ejercicios anteriores. Has aprendido a añadir parámetros a tus propias definiciones de funciones, a devolver un valor o varios valores con tuplas y a llamar a las funciones que has definido.
En este ejercicio y en el siguiente, reunirás todos estos conceptos y los aplicarás a un sencillo problema de ciencia de datos. Cargarás un conjunto de datos y desarrollarás funcionalidades para extraer información sencilla de los datos.
Para este ejercicio, tu objetivo es recordar cómo cargar un conjunto de datos en un DataFrame. El conjunto de datos contiene datos de Twitter e iterarás sobre las entradas de una columna para construir un diccionario en el que las claves son los nombres de los idiomas y los valores son el número de tweets en el idioma dado. El archivo tweets.csv
está disponible en tu directorio actual.
Ten en cuenta que se trata de datos reales de Twitter y, como tales, siempre existe el riesgo de que contengan blasfemias u otros contenidos ofensivos (en este ejercicio y en los siguientes que también utilicen datos reales de Twitter).
Este ejercicio forma parte del curso
Introducción a las funciones en Python
Instrucciones de ejercicio
- Importa el paquete de pandas con el alias
pd
. - Importa el archivo
'tweets.csv'
mediante la función de pandasread_csv()
. Asigna el DataFrame resultante adf
. - Completa el bucle
for
al iterar sobrecol
, la columna'lang'
del DataFramedf
. - Completa los cuerpos de las sentencias
if-else
en el bucle for: si la clave está en el diccionariolangs_count
, añade1
al valor correspondiente a esta clave en el diccionario, si no, añade la clave alangs_count
y establece el valor correspondiente en1
. Utiliza la variable de bucleentry
en tu código.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Import pandas
# Import Twitter data as DataFrame: df
df = ____
# Initialize an empty dictionary: langs_count
langs_count = {}
# Extract column from DataFrame: col
col = df['lang']
# Iterate over lang column in DataFrame
for entry in ____:
# If the language is in langs_count, add 1
if entry in langs_count.keys():
____
# Else add the language to langs_count, set the value to 1
else:
____
# Print the populated dictionary
print(langs_count)