爬虫爬取信息不会选定元素 5C

https://book.douban.com/subject/25862578/
想爬去这个网址的(解忧杂货店)的ISBN号,(在作者,出版社等信息的最下面)。
F12看代码:

ISBN: " 9787544270878"

那么应该如何获得"9787544270878"这个号呢?他没在标签里,实在是不知道怎么写。
isbn = tree.xpath('//span[@class="pl"]//span/text()') #这是我的尝试,是错的。

真心求教,懂了这个问题,以后很多就能融会贯通了。谢谢

2个回答

正则表达式提取下

 (?<=ISBN\:\"\s)\d+(?=\")

我试着成功了,用的BeautifulSoup,我这还有完整代码,要是要就说一声:
isbn=tree.select("#info")[0].find_all(name="span",text="ISBN:")[0].next_sibling.strip(" ")
print(isbn) #9787544270878

weixin_34957230
火拉马车 大哥想看下全部要代码。我试着有点问题。 'HtmlElement' object has no attribute 'select'
一年多之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问