Omitir datos defectuosos
En este ejercicio usarás parámetros de read_csv() para manejar archivos con datos defectuosos, como registros con más valores que columnas. De forma predeterminada, intentar importar esos archivos provoca un error específico: pandas.errors.ParserError.
Algunas líneas en estos datos fiscales de Vermont están corruptas. Para poder cargar las líneas correctas, tenemos que indicar a pandas que omita los errores. También queremos que pandas nos avise cuando se salte una línea para conocer el alcance de los problemas de datos.
pandas se ha importado como pd. El código del ejercicio intentará leer el archivo. Si se produce un pandas.errors.ParserError, se ejecutará el código del bloque except.
Este ejercicio forma parte del curso
Ingesta de datos eficiente con pandas
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
try:
# Import the CSV without any keyword arguments
data = ____
# View first 5 records
print(data.head())
except pd.errors.ParserError:
print("Your data contained rows that could not be parsed.")