from requests_html import HTMLSession
se = HTMLSession()
url ='
https://www.jipinwx.cc/daomubiji8/1586266.html'
https://www.jipinwx.cc/daomubiji8/1586266.html'
r = se.get(url)
r.encoding = r.apparent_encoding
#print(r.text)
cc = r.html.xpath('//div[@class="contentbox"]', first=True).text
print(cc)
#这个first作用到底是什么?不添加first=True括号后面的text就会报错,但是既然是第一个为真实的意思,为什么会把网页上第二个元素也打印出来了,就是后面多了多余的文字,但是我也换过另外一个网站,只打印第一个,小说文字都没有,实在不明白怎么回事???