ComenzarEmpieza gratis

Comparar nombres con DIFFERENCE()

En el ejercicio anterior, usaste SOUNDEX() para revisar los nombres de los estadísticos en la tabla flight_statistics.

Ahora quieres hacer algo similar, pero usando la función DIFFERENCE(). DIFFERENCE() devuelve 4 cuando hay una coincidencia idéntica o muy similar entre dos cadenas, y 0 cuando hay poca o ninguna similitud.

Si el resultado de DIFFERENCE() entre dos cadenas es 4, pero los textos que comparas son diferentes, habrás encontrado datos que necesitas limpiar.

Este ejercicio forma parte del curso

Limpieza de datos en bases de datos SQL Server

Ver curso

Instrucciones del ejercicio

  • Selecciona los valores distintos de las columnas statistician_name y statistician_surname de S1.
  • Haz un INNER JOIN de la tabla flight_statistics como S2 con nombres y apellidos que suenen de forma similar, en los casos en que el DIFFERENCE entre la columna de cada tabla sea 4.
  • Excluye los valores donde las columnas statistician_name y statistician_surname sean diferentes entre sí en S1 y S2, respectivamente.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

SELECT 
    -- First name and surnames of the statisticians
	DISTINCT S1.___, S1.___
-- Join flight_statistics with itself
FROM ___ S1 INNER JOIN ___ S2 
	-- The DIFFERENCE of the first name and surname has to be equals to 4
	ON ___(S1.___, S2.___) = 4
	AND ___(S1.___, S2.___) = 4
-- The texts of the first name or the texts of the surname have to be different
WHERE S1.___ <> S2.___
	OR S1.___ <> S2.___
Editar y ejecutar código