Merhaba,
Bu yazımda sizlere pyquery modülünden bahsedeceğim. Bu modül başlı başına bir parseleme modülü. Güzel olan yanı ise tamamiyle herşeyi sizin kontrolünüze veriyor. Peki bunun olayı ne?
Bu modül ile siz hedef sitenin verilerini alabilir, o özelliklerine(class, style vb.) müdahale edebilirsiniz. Python ile gelen pyquery modülünün jquery desteğinin olmasından dolayı bu tip özellikler var. Bu yüzden jquery bilginiz varsa rahatlıkla müdahaleler yapabilirsiniz. Sizlere örnekle göstermek gerekirisem;
Kurulum yapıyoruz ilk olarak
sudo pip install pyquery
Sonrasında işlemler başlıyor:
from pyquery import PyQuery
site = PyQuery("https://yazilimtoplulugu.com/")
print site('title').html()
bizim sitenin başlığını almış olduk.
eğer herhangi bir class, style gibi işlemlere müdahale etmek istiyorsak;
site_satir = PyQuery('<div class="test_sinifi"><a href="">test</a></div>')
site_satir.remove_attr('class')
print site_satir
bu şekilde ise class tanımını kaldırmış olduk. Eğer class içerisinde herhangi bir tasarım vb. bir işlem varsa onlar kaldırılmış şekilde çekilmiş olacaktır.
Bu ve daha fazlası için pyquery tutorial sayfasını ziyaret ediniz.
İyi çalışmalar.