#coding=utf8
Import urllib2
Import codecs
Import re
Import time
From lxml導(dǎo)入樹
URL 1=';
path 1='//*[@ id=' portal _ block _ 62 _ content ']/div/ul/Li[1]/a/@
path 3='//*[@ class=' t _ f ']/font/text()'
Def geturlinfo(url、path、x):
Request=urllib2。Request(url)
Response=urllib2.urlopen(請求)
Result=re()
Restree=e(result)
節(jié)點(diǎn)=re(路徑)
If x=='1':
Return nodes[0]
Else:
I=0
打開(';' w ')。write(' ')
For node in nodes:
If re.search(': ',node):
info=str(I)' : ' node . replace(' \ r \ n ','')
Print INFO
打開(';' a ')。寫入程序(“utf8”)“\ n”)
I=1
If _ _ name _ _==' _ _ main _ _ ' :
While True:
print '=============start===============================
URL 2=' http://' URL 1 . replace(' http://',')。split ('/') [0]'/'geturlinfo(
Print 'GET From:' url2
Geturlinfo(url2、path3、' 0 ')
(24*3600)
#starts-with(@id,' test') id已經(jīng)以test開頭
#首先導(dǎo)入相應(yīng)的div,然后再次XPath string(.)組合
1.《迅雷客戶端代碼怎么用?我來告訴你答案簡單幾行代碼,獲取每日迅雷會(huì)員python爬蟲(附源碼)》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識,僅代表作者本人觀點(diǎn),與本網(wǎng)站無關(guān),侵刪請聯(lián)系頁腳下方聯(lián)系方式。
2.《迅雷客戶端代碼怎么用?我來告訴你答案簡單幾行代碼,獲取每日迅雷會(huì)員python爬蟲(附源碼)》僅供讀者參考,本網(wǎng)站未對該內(nèi)容進(jìn)行證實(shí),對其原創(chuàng)性、真實(shí)性、完整性、及時(shí)性不作任何保證。
3.文章轉(zhuǎn)載時(shí)請保留本站內(nèi)容來源地址,http://f99ss.com/gl/3140770.html