selenium中webdriver的局部HTML提取

35050阅读 0评论2016-03-19 五岳之巅
分类:Python/Ruby

      别和我说selenium中的webdriver用driver.page_source,我就是不想把整篇HTML文档每次都全部提出来做Soup。因为,对下面这样左右结构的论坛而言,每次内容的改变对于整个HTML页面而言实在是一个很小的部分,如果我想把整个网站所有MOOC课程评论爬下来的话,将要做多少无用功!
     然而,百度遍中文内容并无解答。于是翻出去Google了一把,发现世界上已有前辈对该问题进行了解答: 

     主要思路是使用get_attribute方法,提取innerHTML,如下:

     经验证,一切OK:
上一篇:Windows Server 2003/2008无法安装Python的解决方案
下一篇:Selenium在Win10下IE浏览器遇到的白屏初始页面解决方案