2 u014148140 u014148140 于 2015.07.26 09:25 提问

Python用BeautifulSoup里的get_text(),为什么不能输出"女间谍"

才学python爬虫(python3.4),如何输出里面的"女间谍"呢?求教

htmll ='''<a class="nbg" href="http://movie.douban.com/subject/25752261/" title="女间谍">
<img alt="女间谍" class="" src="http://img4.douban.com/view/movie_poster_cover/ipst/public/p2254455238.jpg"/>
</a>'''

from bs4 import BeautifulSoup
soup = BeautifulSoup(htmll)
print(soup.a.img.get_text())   #输出结果为空


2个回答

u012374229
u012374229   2015.07.26 11:00
已采纳

img是个非封闭标签,哪里有text?改成 soup.a.img['alt']才行, 还有html1的赋值, 应该是三引号吧,复制代码时不要弄错了

u014148140
u014148140 谢谢,会了。问下为什么非封闭标签没有text
2 年多之前 回复
oyljerry
oyljerry   Ds   Rxr 2015.07.26 14:12

你找到img标签后,需要去获取属性alt的值才能拿到对应的字符串。
用.attrs,然后字典中指定alt的key。

u014148140
u014148140 thanks
2 年多之前 回复
Csdn user default icon
上传中...
上传图片
插入图片