ComenzarEmpieza gratis

Unirlo todo (1)

Ya has probado a escribir tus propias funciones en los ejercicios anteriores. Has aprendido a añadir parámetros a tus propias definiciones de funciones, a devolver un valor o varios valores con tuplas y a llamar a las funciones que has definido.

En este ejercicio y en el siguiente, reunirás todos estos conceptos y los aplicarás a un sencillo problema de ciencia de datos. Cargarás un conjunto de datos y desarrollarás funcionalidades para extraer información sencilla de los datos.

Para este ejercicio, tu objetivo es recordar cómo cargar un conjunto de datos en un DataFrame. El conjunto de datos contiene datos de Twitter e iterarás sobre las entradas de una columna para construir un diccionario en el que las claves son los nombres de los idiomas y los valores son el número de tweets en el idioma dado. El archivo tweets.csv está disponible en tu directorio actual.

Ten en cuenta que se trata de datos reales de Twitter y, como tales, siempre existe el riesgo de que contengan blasfemias u otros contenidos ofensivos (en este ejercicio y en los siguientes que también utilicen datos reales de Twitter).

Este ejercicio forma parte del curso

Introducción a las funciones en Python

Ver curso

Instrucciones de ejercicio

  • Importa el paquete de pandas con el alias pd.
  • Importa el archivo 'tweets.csv' mediante la función de pandas read_csv(). Asigna el DataFrame resultante a df.
  • Completa el bucle for al iterar sobre col, la columna 'lang' del DataFrame df.
  • Completa los cuerpos de las sentencias if-else en el bucle for: si la clave está en el diccionario langs_count, añade 1 al valor correspondiente a esta clave en el diccionario, si no, añade la clave a langs_count y establece el valor correspondiente en 1. Utiliza la variable de bucle entry en tu código.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Import pandas


# Import Twitter data as DataFrame: df
df = ____

# Initialize an empty dictionary: langs_count
langs_count = {}

# Extract column from DataFrame: col
col = df['lang']

# Iterate over lang column in DataFrame
for entry in ____:

    # If the language is in langs_count, add 1 
    if entry in langs_count.keys():
        ____
    # Else add the language to langs_count, set the value to 1
    else:
        ____

# Print the populated dictionary
print(langs_count)
Editar y ejecutar código