1. 学ぶ
  2. /
  3. コース
  4. /
  5. SQLで学ぶ探索的データ分析

Connected

演習

指標変数を使ってテーブルを作成する

evanston311 データで、優先度が medium と high のリクエストに、依頼者の連絡先情報(メールアドレスまたは電話番号)が含まれている可能性が高いかどうかを確認しましょう。

  • メールには @ が含まれます。
  • 電話番号は、3文字・ハイフン・3文字・ハイフン・4文字のパターンです。例: 555-555-1212。

これらのパターンのマッチには LIKE を使います。% は任意の文字数(0文字も可)にマッチし、_ は任意の1文字にマッチします。パターンの前後を % で囲むと、他のテキストの中からそのパターンを見つけられます。

たとえば、'%___.com%' は、トップレベルドメインが '.com' で、その直前に少なくとも3文字あるウェブサイトへの言及を検索できます。

メールと電話の指標変数を一時テーブルに作成して保存してください。LIKE は結果として True または False を返しますが、ブール値(True/False)を integer にキャストすると、True は 1、False は 0 に変換されます。これにより、後で要約しやすくなります。

指示1 / 2

undefined XP
    1
    2
  • evanston311 からテンポラリテーブル indicators を作成し、列は id、email、phone の3つにします。

  • description に含まれるメールと電話のパターンを検出するために LIKE を使い、結果を CAST() で integer にキャストします。

    • 電話の指標は、標準的な10桁の電話番号形式を表すために、アンダースコア _ とハイフン - を組み合わせて表現してください。
    • パターンの先頭と末尾に % を付けて、他のテキストの中からもパターンを見つけられるようにしましょう!