Tekil değerleri alma
Bazen bir analiz tüm kayıtları değil, bir veya daha fazla sütundaki tekil değerleri gerektirir. Yinelenen değerler veriler bir veri çerçevesine yüklendikten sonra kaldırılabilir, ancak SQL'in DISTINCT anahtar sözcüğüyle içe aktarma sırasında da yapılabilir.
hpd311calls konut sorunlarıyla ilgili veriler içerdiğinden, çoğu kaydın bir ilçe (borough) içerdiğini bekleriz. Bu varsayımı, benzersiz complaint_type/borough kombinasyonlarını sorgulayarak test edelim.
pandas pd takma adıyla içe aktarıldı ve veritabanı motoru engine olarak oluşturuldu.
Not: SQL denetleyicisi sütun konumları konusunda oldukça titizdir ve alanların belirtilen sırada seçilmesini bekler.
Bu egzersiz, kursun bir parçasıdır
pandas ile Kolaylaştırılmış Veri Alımı
Egzersiz talimatları
hpd311callstablosundanboroughvecomplaint_typeiçin (bu sırayla)DISTINCTdeğerleri alan bir sorgu oluştur.- Sorgunun sonuçlarını
read_sql()ileissues_and_borosadlı bir veri çerçevesine yükle. - Edebiyat talepleri dışındaki tüm sorunların listelenmiş ilçelerle birlikte göründüğü varsayımını kontrol etmek için veri çerçevesini yazdır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create query for unique combinations of borough and complaint_type
query = """
SELECT ____ ____,
____
____ hpd311calls;
"""
# Load results of query to a dataframe
issues_and_boros = ____
# Check assumption about issues and boroughs
print(____)