全部分类
移动开发与应用
WEB前端
架构与运维
程序设计
数据库
操作系统
热点技术
综合
selenium中webdriver的局部HTML提取
35080阅读 0评论
2016-03-19
五岳之巅
分类:
Python/Ruby
别和我说
selenium中的
webdriver用
driver.page_source,我就是不想把整篇HTML文档每次都全部提出来做Soup。因为,对下面这样左右结构的论坛而言,每次内容的改变对于整个HTML页面而言实在是一个很小的部分,如果我想把整个网站所有MOOC课程评论爬下来的话,将要做多少无用功!
然而,百度遍中文内容并无解答。于是翻出去Google了一把,发现世界上已有前辈对该问题进行了解答:
主要思路是使用get_attribute方法,提取innerHTML,如下:
经验证,一切OK:
上一篇:
Windows Server 2003/2008无法安装Python的解决方案
下一篇:
Selenium在Win10下IE浏览器遇到的白屏初始页面解决方案