1. 学ぶ
  2. /
  3. コース
  4. /
  5. SQL Server データベースでのデータクレンジング

Connected

演習

文字列の統一

同じものに対して異なる値が混在して、文字列が乱れていることはよくあります。どれも一見正しい値かもしれませんが、分析をしやすくするためには統一しておくのが望ましいです。

次のクエリで、都市が'Chicago'にある空港をフィルタしています。

SELECT * FROM airports 
WHERE airport_code IN ('ORD', 'MDW')

結果を見ると、airport_city列に'ch'など、'Chicago'と不一致な値が含まれています。ここでは、これらの不一致な値を置換して整備します。

指示1 / 3

undefined XP
  • 1
    • 'ch'を'Chicago'に置換してください —— 'Chicago'が'Chicagoicago'になってしまう点に注目しましょう。
  • 2
    • CASEを使って、'Chicago'でないすべての行で'ch'を'Chicago'に置換してください。
    • それ以外のairport_cityは変更しないでください。
  • 3
    • 'Chicago'を'ch'に置換し、結果を大文字に変換して、'Chicago'と'ch'を'CH'に統一してください。