1. Learn
  2. /
  3. Kurser
  4. /
  5. Exploratory Data Analysis i SQL

Connected

övning

Skapa en tabell med indikatorvariabler

Undersök om ärenden med medelhög och hög prioritet i evanston311-data är mer benägna att innehålla kontaktinformation från den som skickat in ärendet – det vill säga en e-postadress eller ett telefonnummer.

  • E-postadresser innehåller ett @.
  • Telefonnummer följer mönstret tre tecken, bindestreck, tre tecken, bindestreck, fyra tecken. Till exempel: 555-555-1212.

Använd LIKE för att matcha dessa mönster. Kom ihåg att % matchar hur många tecken som helst (även 0), och _ matchar exakt ett tecken. Genom att omge ett mönster med % (det vill säga före och efter mönstret) kan du hitta det inuti längre text.

Exempelvis skulle '%___.com%' låta dig söka efter en referens till en webbplats med toppdomänen '.com' och minst tre tecken före den.

Skapa och lagra indikatorvariabler för e-post och telefon i en temporär tabell. LIKE returnerar True eller False, men om du konverterar ett booleskt värde (True eller False) till ett integer omvandlas True till 1 och False till 0. Det gör värdena enklare att sammanfatta senare.

Instruktioner 1/2

undefined XP
    1
    2
  • Skapa en temporär tabell indicators från evanston311 med tre kolumner: id, email och phone.

  • Använd LIKE-jämförelser för att identifiera e-post- och telefonnummermönster i kolumnen description, och konvertera resultatet till ett heltal med CAST().

    • Din telefonindikator ska använda en kombination av understreck _ och bindestreck - för att representera ett standardformat för 10-siffriga telefonnummer.
    • Kom ihåg att börja och avsluta dina mönster med % så att du kan hitta mönstret inuti längre text!