or
Este ejercicio forma parte del curso
En este capítulo, configurarás tu entorno de Databricks y explorarás el conjunto de datos abierto de Airbnb. Aprenderás habilidades esenciales de SQL para consultar, filtrar y resumir datos dentro de Databricks Lakehouse. A través de ejercicios, practicarás cómo simplificar consultas complejas con subconsultas y optimizar el rendimiento en conjuntos de datos grandes usando el comando `OPTIMIZE`. Este capítulo te proporciona las bases necesarias para analizar y gestionar datos de forma eficiente en Databricks.
En este capítulo, explorarás técnicas analíticas avanzadas utilizando el conjunto de datos de Airbnb en Databricks SQL Notebooks. Mediante ejercicios prácticos, calcularás estadísticas descriptivas y aprovecharás funciones de ventana para cálculos complejos. También realizarás ingeniería de características para crear métricas significativas que impulsen conclusiones accionables. Al final de este capítulo, estarás preparado para aplicar con confianza analítica avanzada en escenarios reales de consultoría para obtener insights accionables, alineándote con la estrategia basada en datos de Data X.
La visualización de datos es una herramienta potente para mejorar la comprensión de conjuntos de datos complejos y comunicar conclusiones clave de forma eficaz. En este capítulo, explorarás el arte y la ciencia de diseñar visualizaciones interactivas y crear paneles completos usando Databricks. Aprovechando distintos tipos de gráficos, como barras, mapas de calor y mapas, descubrirás distribuciones, correlaciones y tendencias geográficas. Los filtros interactivos permitirán explorar dinámicamente barrios, puntuaciones de reseñas y rangos de precios.
Ejercicio actual