1. 学ぶ
  2. /
  3. コース
  4. /
  5. SQL Server データベースでのデータクレンジング

Connected

演習

フライト表記の統一 I

分析の前には、しばしば生データのクリーニングが必要になります。現実のデータはきれいとは限らないからです。

この演習では、flight_statistics テーブルから遅延が 100 件を超えるレコードを取得します。さらに、carrier_code、registration_code、airport_code を連結して、"AA - 000000119, JFK" のような形式の一意な列を作成します。

flight_statistics テーブルを確認すると、registration_code に異なる書式が混在していることに気づきます。正しい registration_code は 9 桁で、足りない場合は先頭をゼロで埋める必要があります。

これには、REPLICATE() を LEN() と CONCAT() と組み合わせて使うことができます。

指示

100 XP
  • carrier_code、先頭ゼロで埋めた registration_code、registration_code、airport_code を、適切な関数で連結してください。
  • 各 registration_code の長さから 9 を引いた数だけゼロを複製して、必要な数のゼロを付与します。
  • delayed 列が 100 を超えるレコードのみを抽出します。