HTML’in yapısını öğren. Önce web scraping’in veri bilimi araç kutuna neden değer kattığını açıklıyor, sonra HTML’in temellerine dalıyoruz. Bölümü, HTML kodundaki öğeler arasında gezinmek için kullanılan XPath gösterimine kısa bir girişle bitiriyoruz.

Web Scraping’e Genel Bakış

Web scraping saçmalık değildir!

HyperText Markup Language

HTML ağacında sözel gezinme

Ağaçtan HTML'ye

Öznitelikler

Sınıfı Koru

href bulma

XPath Hızlandırılmış Kursu

Neredeyim?

P Zamanı

Havalı bir span

HTML’e Giriş

scrapy seçicilerini keşfetmek için XPath söz diziminden yararlan. Bu iki kavram, bir HTML belgesini kazıyabilmene doğru seni bir adım daha yaklaştıracak.

XPatholoji

Doğada Öğeleri Saymak

Gövde Eklentileri

DataCamp'i Seç!

Alışılagelmiş XPath'in Dışına Çık

Where it's @

Sınıfını Kontrol Et

Hiper(bağlantı) Aktif

Gizli Bağlantılar

Seçici Nesneler

XPath Zincirleme

Bu Egzersizi Bölümlere Ayıralım

Kaynağın Kaynağı

İnceleyerek Course Class Bulma

Bir Selector İstemek

XPath’ler ve Seçiciler

CSS Konumlayıcı söz dizimini öğren ve CSS Konumlayıcıları XPath ile zincirleme fikriyle oynamaya başla. Ayrıca, Seçiciler gibi davranıp birden çok web sitesinde kazıma çabalarımızı harekete geçirmek için ek araçlar sunan Response nesnelerini tanıtıyoruz.

XPath'ten CSS'e

CSS Bulucularına (X)Path

Bu Kurstan bir "a" Al

CSS Joker Karakteri

CSS Öznitelikleri ve Metin Seçimi

`href`lendin

En Üst Düzey Metin

Tüm Düzey Metni

Lütfen Yanıt Ver!

Response ile Ortaya Çıkar

Selector'larla Yanıtlamak

Bir Seçimden Seçmek

Anket

Başlık Avı

Child öğeleriyle kazıma

CSS Konumlayıcılar, Zincirleme ve Yanıtlar

scrapy ile web tarayıcıları oluşturmayı öğren. Bu scrapy spider’ları, önceki bölümlerde öğrendiğimiz adımlara göre bağlantıları takip ederek birden çok sayfa üzerinden web’i otomatik olarak tarayacak.

İlk Spider'ını Yaz

Spider'dan Kalıtım

URL’leri Savur

İstekleri Başlat

Kendine Referans Vermek Ne Kadar Şık

Start Requests ile Başlamak

Ayrıştır ve Tırman

Mahlaslar

Tarayıcı Zamanı

Bitirme Projesi

Çalıştırma Zamanı

DataCamp Açıklamaları

Kapsamlı Crawler

Final

Spider’lar

DataCamp webpage HTML

İnternete yayılmış bilgileri alıp ayrıştırabilen araçlar geliştirmek, veri biliminin pek çok alanında geçmişte olduğu gibi bugün de değerlidir. Bu derste HTML kodunu nasıl gezip ayrıştıracağını ve web sitelerini otomatik olarak tarayacak araçlar geliştirmeyi öğreneceksin. Kazıma işlemlerimizi çok yönlü Python kütüphanesi scrapy ile yapıyor olsak da, burada öğreneceğin pek çok tekniği BeautifulSoup ve Selenium gibi diğer popüler Python kütüphanelerinde de uygulayabilirsin. Dersi tamamladığında HTML yapısını zihninde sağlam bir modele oturtacak, HTML kodunu ayrıştırıp istediğin bilgilere erişecek araçlar geliştirebilecek ve web’i ölçekli bir şekilde taramak için basit scrapy spider’ları oluşturabileceksin.

Intermediate Python

Python kütüphanesi scrapy ile internetten bilgi almayı ve işlemeyi öğrenin.

Python ile Web Scraping

Python kütüphanesi scrapy kullanarak internetten bilgi almayı ve ayrıştırmayı öğrenin.

Öznitelikler

Create Your Free Account