fuyunkaka
fuyunkaka
2016-05-20 08:42
采纳率: 42.9%
浏览 3.3k
已采纳

python 爬虫 怎么获取标签中的注释?我用得lxml解析html

 <span>当前第9127页&nbsp;<!--共136904条-->&nbsp;&nbsp;</span>

怎么才能获取注释里的值呢?

tree=etree.HTML(page)
pagenumber=tree.xpath(xpathStr)
for i in pagenumber:
           totalpage=filter(str.isdigit,str(i))

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 邀请回答

1条回答 默认 最新

  • oyljerry
    oyljerry 2016-05-20 09:03
    已采纳

    注释不属于xml格式了,你拿到span节点后获取它的内容,然后用字符串解析来获取注释。

    点赞 评论

相关推荐