百度搜索手机壁纸,一般有10个标题,我想把这些标题都提取出来
然后用xpath提取的,用F12调出页面尝试提取可以完整取出,但是在pychram中运行时,提取出来的结果是
['手机壁纸', ' - 百度图片', '【', '手机壁纸', '】高清', '手机壁纸',]
同一个标题下em标签加强的文字和其他文字都被隔断了
代码如下:
tree=etree.HTML(html)
titles=tree.xpath('//div[@id="content_left"]//h3/a//text()')
print(titles)
希望能完整的提取出标题,不知道是哪里出问题了,求指点