發(fā)布時(shí)間:2022-10-24
欄目:電商資訊
代碼如下:
#-*-coding:UTF-8-*-
”’
Createdon2021-12-5

@author:good-temper
”’
importurllib2
importbs4
importtime
defgetPage(urlStr):
”’
獲取頁(yè)面內(nèi)容
”’
content=urllib2.urlopen(urlStr).read()
returncontent
defgetNextPageUrl(currPageNum):
#頁(yè)碼-1-1-72-4137-33.html
url=u’‘+str(currPageNum+1)+’-1-1-72-4137-33.html’
#是否有下一頁(yè)
content=getPage(url);
soup=bs4.BeautifulSoup(content)
list=soup.findAll(‘span’,{‘class’:’next-disabled’});
if(len(list)==0):
returnurl
return”
defanalyzeList():
pageNum=0
list=[]
url=getNextPageUrl(pageNum)
whileurl!=”:
soup=bs4.BeautifulSoup(getPage(url))
pagelist=soup.findAll(‘div’,{‘class’:’p-name’})
foreleminpagelist:
soup1=bs4.BeautifulSoup(str(elem))
list.append(soup1.find(‘a(chǎn)’)[‘href’])
pageNum=pageNum+1
printpageNum
url=getNextPageUrl(pageNum)
returnlist

defanalyzeContent(url):
return”
defwriteToFile(list,path):
f=open(path,‘a(chǎn)’)
foreleminlist:
f.write(elem+’
’)
f.close()
if__name__==‘__main__’:
list=analyzeList()

print‘共抓取’+str(len(list))+’條
’
writeToFile(list,u’E:\\jd_phone_list.dat’);
轉(zhuǎn)載請(qǐng)注明:seo-網(wǎng)站優(yōu)化-網(wǎng)站建設(shè)?python抓取京東商城手機(jī)列表url實(shí)例代碼
文章地址:http://61py.com/article/online/12705.html

- 1互聯(lián)網(wǎng)對(duì)傳統(tǒng)企業(yè)的沖擊有多大
- 2美團(tuán)再因不正當(dāng)競(jìng)爭(zhēng)敗訴新反法互聯(lián)網(wǎng)專條首次適用外賣領(lǐng)域!
- 32021互聯(lián)網(wǎng)十件大事對(duì)不起賈躍亭你只能排第四
- 4互聯(lián)網(wǎng)宣傳做的就是用戶體驗(yàn)
- 5互聯(lián)網(wǎng)創(chuàng)業(yè)到底需要怎樣的能力
- 6適合上班族的25個(gè)副業(yè)(適合上班族的互聯(lián)網(wǎng)副業(yè))
- 7互聯(lián)網(wǎng)的世界沒有永遠(yuǎn)的敵人只有永遠(yuǎn)的利益
- 8押?jiǎn)h進(jìn)駐天線貓助力互聯(lián)網(wǎng)數(shù)碼產(chǎn)品寄存行業(yè)經(jīng)濟(jì)持續(xù)發(fā)展
- 9互聯(lián)網(wǎng)公司如何做好品牌定位
- 102021年互聯(lián)網(wǎng)金融發(fā)展回顧冬去春欲來(lái)改弦當(dāng)更張