开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 20920|回复: 8
收起左侧

[python] pyhton2.7+selenium3.1+chromedriver 爬虫问题

[复制链接]
结帖率:0% (0/1)
发表于 2019-2-18 11:42:47 | 显示全部楼层 |阅读模式   福建省厦门市
5精币
  
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait # available since 2.4.0
from selenium.webdriver.support import expected_conditions as EC # available since 2.26.0
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.remote.webelement import WebElement
from time import sleep
import traceback

chrome_options = Options ()
chrome_options.add_argument ( ' --headless')
# chrome_options.add_argument ( ' --disable-gpu')

driver = webdriver.Chrome ("C:\Program Files\Python2\chromedriver.exe",chrome_options=chrome_options)
driver.maximize_window ()        
# driver.get ("https://www.baidu.com")
driver.get ("https://www.nextbet.com/en/sports")
print (driver.title)
# 繁体字
html = driver.execute_script ("return document.documentElement.outerHTML")

try:
element = WebDriverWait (driver, 360).until (EC.presence_of_element_located ( (By.CLASS_NAME, "event-header-title")))
#driver .find_element_by_id ("").
eles = driver.find_elements_by_class_name ("event-header-title");
for ele in eles:
temp = ele.get_attribute ("outerHTML")
except Exception,e:  
traceback.print_exc ()

html = driver.execute_script ("return document.documentElement.outerHTML")

sleep (3)


如代码展示,如果去掉 "--headless" 可以正常抓取到dom并且进行操作,反之虽然有等待".event-header-title"加载完成的语句,并且执行到下一步抓取到n个eles集合,但是遍历获取html属性的时候报异常,是chromedriver的和windows下chrome浏览器版本的问题吗?


回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳
发表于 2019-2-19 17:25:44 | 显示全部楼层   山东省潍坊市
可能是chromedriver版本问题
回复

使用道具 举报

结帖率:0% (0/1)
 楼主| 发表于 2019-2-25 12:07:56 | 显示全部楼层   福建省厦门市
swpy 发表于 2019-2-19 17:25
可能是chromedriver版本问题

嗯,我再试试
回复

使用道具 举报

发表于 2019-3-5 15:18:20 | 显示全部楼层   河南省济源市
upupupupup
回复

使用道具 举报

结帖率:100% (1/1)
发表于 2019-3-23 16:57:01 | 显示全部楼层   湖南省长沙市
异常捕获那个e就是原因,猜测应该是某条元素没有那个attribute属性吧
回复

使用道具 举报

结帖率:100% (1/1)
发表于 2019-5-2 03:21:42 | 显示全部楼层   湖南省长沙市
可能是,但是更多可能是页面加载未完成,报的什么异常
回复

使用道具 举报

发表于 2019-9-6 01:59:22 | 显示全部楼层   湖南省长沙市
或许也有可能是元素未加载完全
回复

使用道具 举报

结帖率:97% (34/35)
发表于 2019-10-13 16:56:26 | 显示全部楼层   内蒙古自治区呼和浩特市
此类问题加qq 8128697 有偿解决
回复

使用道具 举报

发表于 2020-5-25 23:09:47 | 显示全部楼层   四川省成都市
看看具体的异常信息,可能是获取到的元素为空强行取值造成的
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 诚聘英才| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 800073686,邮箱:800073686@b.qq.com
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表