Comprender tus datos de clasificación

Ahora empezarás a modelar con un nuevo conjunto de datos para un problema de clasificación. Estos datos incluyen información sobre los pasajeros del Titanic. Utilizarás predictores como age, fare y el lugar de embarque de cada pasajero para predecir quién sobrevivirá. Estos datos proceden de un tutorial sobre concursos de ciencia de datos. Mira aquí para ver descripciones de las características.

Los datos se cargan previamente en un DataFrame de pandas llamado df.

Es inteligente revisar los valores máximo y mínimo de cada variable para asegurarse de que los datos no están mal formateados o corruptos. ¿Cuál era la edad máxima de los pasajeros del Titanic? Utiliza el método .describe() de la Shell IPython para responder a esta pregunta.

Este ejercicio forma parte del curso

Introducción al Aprendizaje Profundo en Python

Ver curso

Ejercicio interactivo práctico

Convierte la teoría en acción con uno de nuestros ejercicios interactivos

Empieza a hacer ejercicio