ComenzarEmpieza gratis

Omitir datos defectuosos

En este ejercicio usarás parámetros de read_csv() para manejar archivos con datos defectuosos, como registros con más valores que columnas. De forma predeterminada, intentar importar esos archivos provoca un error específico: pandas.errors.ParserError.

Algunas líneas en estos datos fiscales de Vermont están corruptas. Para poder cargar las líneas correctas, tenemos que indicar a pandas que omita los errores. También queremos que pandas nos avise cuando se salte una línea para conocer el alcance de los problemas de datos.

pandas se ha importado como pd. El código del ejercicio intentará leer el archivo. Si se produce un pandas.errors.ParserError, se ejecutará el código del bloque except.

Este ejercicio forma parte del curso

Ingesta de datos eficiente con pandas

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

try:
  # Import the CSV without any keyword arguments
  data = ____
  
  # View first 5 records
  print(data.head())
  
except pd.errors.ParserError:
    print("Your data contained rows that could not be parsed.")
Editar y ejecutar código