1. 学ぶ
  2. /
  3. コース
  4. /
  5. SQL Serverで学ぶ時系列分析

Connected

演習

不正の可能性を分析する(クライアントデータ)

この最終セットの演習では、デイスパのデータを分析して不正の可能性を探ります。弊社では、各顧客に個人用のパスを1枚とゲストパスを1枚付与しています。各クライアントのチェックイン/チェックアウトのデータがあり、ゲストパスは元の顧客IDにひも付きます。つまり、クライアントとゲストが一緒にチェックインすると、滞在時間が重なる可能性があります。1人のクライアントについて、少なくとも3つの重複エントリがあるかを確認したいのですが、これはビジネスルール違反にあたります。

重複エントリを考えるカギは、データをアンピボットして、入場と退場のイベントストリームとして捉えることです。まずはそこから始めます。

指示

100 XP

開始イベントと終了イベントに分割します。

  • クエリの「entrances」パートでは、顧客の訪問開始日時(dsv.CustomerVisitStart)を TimeUTC に入力します。
  • 各顧客について訪問開始日時順にチェックインの流れを作るため、StartStopPoints というエイリアスを付けるウィンドウ関数を入力します。
  • クエリの「departures」パートでは、顧客の訪問終了日時(dsv.CustomerVisitEnd)を TimeUTC に入力します。