1. 학습
  2. /
  3. 강의
  4. /
  5. SQL Server 데이터베이스에서 데이터 정제하기

Connected

연습 문제

문자열 통일하기

같은 대상을 가리키는데 값이 제각각이면 문자열이 지저분해 보이기 쉽습니다. 값 자체는 모두 유효하더라도, 분석을 잘하려면 형식을 통일하는 편이 좋습니다.

다음 쿼리를 실행해 도시가 'Chicago'인 모든 공항을 필터링합니다:

SELECT * FROM airports 
WHERE airport_code IN ('ORD', 'MDW')

결과를 보면 airport_city 열에서 'Chicago'가 일관되지 않게 표기되어 있고, 'ch' 같은 값도 있습니다. 이제 이런 불일치 값을 치환하여 정리해 보겠습니다.

지침 1/3

undefined XP
  • 1
    • 'ch'를 'Chicago'로 바꾸세요. — 그러면 'Chicago'가 'Chicagoicago'로 변하는 것을 확인할 수 있어요.
  • 2
    • CASE를 사용해 'Chicago'가 아닌 모든 행에서 'ch'를 'Chicago'로 바꾸세요.
    • 그 외에는 airport_city를 변경하지 마세요.
  • 3
    • 'Chicago'와 'ch'를 모두 'CH'로 통일하세요. 방법: 'Chicago'를 'ch'로 치환한 뒤 결과를 대문자로 변환하세요.