自拍偷在线精品自拍偷|国产无码一区二区久久|最新版天堂资源中文官网|国产精品第一页爽爽影院|国产精品一区二区av不卡|久久久波多野av一区无码|国产欧美日本亚洲精品一4区|亚洲精品天堂在线观看2020

當前位置：首頁 > 網(wǎng)站建設(shè) > 正文內(nèi)容

selenium獲取網(wǎng)頁源碼太慢(selenium獲取頁面元素及個數(shù))

網(wǎng)站建設(shè)1年前 (2023-10-07)482

沒有不能查看源代碼的網(wǎng)頁，點一下F12或者1抓包，找到真正的url，模擬post或get2用selenium+phantomjs 或firefox 或chrome。

不用說，當然是把腳本轉(zhuǎn)為java代碼了，在E clipse中重新開始搞選擇一個測試框架有Junit和TestNg兩個選擇，公司用的是junit，所以，不用多說，我就用junit驗證selenium腳本的運行結(jié)果并且，Junit和Test。

我當時遇到的問題是chromedriveexe版本過低和chrome瀏覽器兼容性不好，可以試一下高版本的chromedriveexe試一下，僅供產(chǎn)考。

chrome_options=chrome_optionschromeget#39的話抓取速度就很慢了，加上代理的話如果代理不穩(wěn)定可能還會慢出一大截。

可能是頁面加載比較慢還沒加載出來，selenium如何用python的selenium提取頁面所有資源加載的鏈接答用瀏覽器打開你那個連接完整加載，通過查看源找到你要的數(shù)據(jù)記住標記，比如某個元素，selenium+python獲取到頁面。

driverpage_source是只能獲取源碼的如果是需要加載的，你需要用匹配，比如browserfind_elements_by_xpath。

3 配置采集規(guī)則可以使用智能識別功能，讓八爪魚自動識別頁面的數(shù)據(jù)結(jié)構(gòu)，或者手動設(shè)置采集規(guī)則4 如果手動設(shè)置采集規(guī)則，可以通過鼠標選擇頁面上的數(shù)據(jù)元素，并設(shè)置相應(yīng)的采集規(guī)則，以確保正確獲取所需的數(shù)據(jù)5 設(shè)置翻頁。