精品一区二区三区高清免费不卡|在线观看最新中文字幕AV|欧美成人久久久免费播放|国产欧美日韩精品a

當(dāng)前位置:首頁 > 軟件開放 > 正文內(nèi)容

網(wǎng)站源碼爬?。ǐ@取網(wǎng)站源碼)

軟件開放2年前 (2023-01-12)2101

今天給各位分享網(wǎng)站源碼爬取的知識(shí),其中也會(huì)對獲取網(wǎng)站源碼進(jìn)行解釋,如果能碰巧解決你現(xiàn)在面臨的問題,別忘了關(guān)注本站,現(xiàn)在開始吧!

本文目錄一覽:

用requests庫爬取網(wǎng)站源碼問題

這個(gè)網(wǎng)頁是JavaScript異步加載的,直接用requests爬不到你想要的網(wǎng)頁源碼。

為什么別人網(wǎng)站源碼中只有少量內(nèi)容,其他通過js實(shí)現(xiàn)

最有可能的原因就是網(wǎng)頁數(shù)據(jù)是動(dòng)態(tài)加載的,存儲(chǔ)在一個(gè)json文件中,直接獲取源碼是提取不到任何信息的,需要抓包分析才行,下面我簡單介紹一下操作過程,以某某貸上的數(shù)據(jù)為例(動(dòng)態(tài)加載):

1.首先,打開原網(wǎng)頁,如下,這里假設(shè)我們要爬取的數(shù)據(jù)包含年利率、借款標(biāo)題、期限、金額和進(jìn)度5個(gè)字段:

2.接著右鍵打開網(wǎng)頁源碼,按Ctrl+F搜索其中關(guān)鍵字,如“10.20%”,可以看到,任何信息都匹配不到,說明數(shù)據(jù)是動(dòng)態(tài)加載的,而非直接嵌套在網(wǎng)頁源碼中:

3.按F12調(diào)出瀏覽器開發(fā)者工具,開始抓包分析,依次點(diǎn)擊“Network”-“XHR”,F(xiàn)5刷新頁面,可以看到,數(shù)據(jù)是動(dòng)態(tài)加載的,存儲(chǔ)在一個(gè)json文件中,而非html網(wǎng)頁源碼,只有解析這個(gè)json文件,才能提取出我們需要的數(shù)據(jù):

4.接著就是根據(jù)抓包結(jié)果解析json文件,已經(jīng)獲取到url地址,所以直接get請求即可,然后用python自帶的json包解析就行,測試代碼如下,非常簡單,依次根據(jù)屬性提取字段信息即可:

5.最后點(diǎn)擊運(yùn)行程序,截圖如下,已經(jīng)成功提取到我們需要的數(shù)據(jù):

至此,我們就完成了網(wǎng)頁動(dòng)態(tài)數(shù)據(jù)的爬取??偟膩碚f,整個(gè)過程非常簡單,最主要的還是抓包分析,獲取到真實(shí)存儲(chǔ)數(shù)據(jù)的文件,然后再解析就行,只要你有一定的python基礎(chǔ),熟悉一下上面的過程,很快就能掌握的,當(dāng)然,如果數(shù)據(jù)或鏈接進(jìn)行了加密處理,這個(gè)就非常復(fù)雜了,需要自己好好琢磨一下,網(wǎng)上也有相關(guān)資料和教程,感興趣的話,可以搜一下,希望以上分享的內(nèi)容能對你有所幫助吧,也歡迎大家評論、留言進(jìn)行補(bǔ)充。

python怎么爬取網(wǎng)頁源代碼

#!/usr/bin/env python3

#-*- coding=utf-8 -*-

import urllib3

if __name__ == '__main__':

http=urllib3.PoolManager()

r=http.request('GET','IP')

print(r.data.decode("gbk"))

可以正常抓取。需要安裝urllib3,py版本3.43

網(wǎng)站源碼爬取的介紹就聊到這里吧,感謝你花時(shí)間閱讀本站內(nèi)容,更多關(guān)于獲取網(wǎng)站源碼、網(wǎng)站源碼爬取的信息別忘了在本站進(jìn)行查找喔。

掃描二維碼推送至手機(jī)訪問。

版權(quán)聲明:本文由飛速云SEO網(wǎng)絡(luò)優(yōu)化推廣發(fā)布,如需轉(zhuǎn)載請注明出處。

本文鏈接:http://www.top3latam.com/post/3578.html

標(biāo)簽: 網(wǎng)站源碼爬取

“網(wǎng)站源碼爬?。ǐ@取網(wǎng)站源碼)” 的相關(guān)文章

網(wǎng)站建設(shè)與管理(網(wǎng)站建設(shè)與管理試卷及答案)

網(wǎng)站建設(shè)與管理(網(wǎng)站建設(shè)與管理試卷及答案)

本篇文章給大家談?wù)劸W(wǎng)站建設(shè)與管理,以及網(wǎng)站建設(shè)與管理試卷及答案對應(yīng)的知識(shí)點(diǎn),希望對各位有所幫助,不要忘了收藏本站喔。 本文目錄一覽: 1、網(wǎng)站建設(shè)與管理出來可以做什么樣的工作 2、網(wǎng)站建設(shè)與管理主要學(xué)什么 3、網(wǎng)站建設(shè)與管理 4、網(wǎng)站建設(shè)與管理專業(yè)描述 網(wǎng)站建設(shè)與管理出來可以做什么樣的...

學(xué)軟件開發(fā)多少錢(學(xué)軟件開發(fā)多少錢?)

學(xué)軟件開發(fā)多少錢(學(xué)軟件開發(fā)多少錢?)

今天給各位分享學(xué)軟件開發(fā)多少錢的知識(shí),其中也會(huì)對學(xué)軟件開發(fā)多少錢?進(jìn)行解釋,如果能碰巧解決你現(xiàn)在面臨的問題,別忘了關(guān)注本站,現(xiàn)在開始吧!本文目錄一覽: 1、社交軟件開發(fā)需要多少錢? 2、軟件開發(fā)培訓(xùn)的費(fèi)用要多少 3、學(xué)軟件開發(fā)工資高嗎? 4、現(xiàn)在的IT培訓(xùn)大概的費(fèi)用一般都是多少錢?...

手機(jī)百度瀏覽器收藏刪除了怎么恢復(fù)(手機(jī)百度刪除的收藏怎么恢復(fù))

手機(jī)百度瀏覽器收藏刪除了怎么恢復(fù)(手機(jī)百度刪除的收藏怎么恢復(fù))

今天給各位分享手機(jī)百度瀏覽器收藏刪除了怎么恢復(fù)的知識(shí),其中也會(huì)對手機(jī)百度刪除的收藏怎么恢復(fù)進(jìn)行解釋,如果能碰巧解決你現(xiàn)在面臨的問題,別忘了關(guān)注本站,現(xiàn)在開始吧!本文目錄一覽: 1、百度瀏覽器收藏誤刪怎么找回 2、手機(jī)百度瀏覽記錄怎么恢復(fù) 3、手機(jī)瀏覽器刪掉怎么找回收藏的網(wǎng)址 4、手機(jī)百度...

齊家裝修網(wǎng)效果圖(齊家裝修效果圖衛(wèi)生間)

齊家裝修網(wǎng)效果圖(齊家裝修效果圖衛(wèi)生間)

今天給各位分享齊家裝修網(wǎng)效果圖的知識(shí),其中也會(huì)對齊家裝修效果圖衛(wèi)生間進(jìn)行解釋,如果能碰巧解決你現(xiàn)在面臨的問題,別忘了關(guān)注本站,現(xiàn)在開始吧!本文目錄一覽: 1、在哪里根據(jù)戶型找裝修效果圖 2、齊家網(wǎng)裝修平臺(tái)可靠嗎 3、齊家網(wǎng)裝修公司怎么樣?如何選擇裝修公司? 4、誰用過齊家網(wǎng)平臺(tái)裝修過呢?...

如何復(fù)制別人的接龍小程序(微信接龍?jiān)趺磸?fù)制別人的)

如何復(fù)制別人的接龍小程序(微信接龍?jiān)趺磸?fù)制別人的)

今天給各位分享如何復(fù)制別人的接龍小程序的知識(shí),其中也會(huì)對微信接龍?jiān)趺磸?fù)制別人的進(jìn)行解釋,如果能碰巧解決你現(xiàn)在面臨的問題,別忘了關(guān)注本站,現(xiàn)在開始吧!本文目錄一覽: 1、接龍管家如何復(fù)制別人發(fā)布的 2、微信接龍?jiān)趺磸?fù)制粘貼往下接 3、微信中怎么接別人發(fā)接龍 接龍管家如何復(fù)制別人發(fā)布的 您好,...

晋城| 安康市| 五原县| 雷州市| 信丰县| 赤城县| 阿瓦提县| 博湖县| 德安县| 华容县| 定西市| 大化| 正安县| 万荣县| 平邑县| 区。| 沾化县| 九龙城区| 英吉沙县| 诸暨市| 莱芜市| 法库县| 宜丰县| 聂荣县| 龙胜| 孟津县| 海林市| 金昌市| 阿拉善右旗| 沁水县| 贡觉县| 松潘县| 浏阳市| 镇江市| 靖宇县| 定西市| 柯坪县| 延津县| 雷州市| 斗六市| 鹤山市|