我想爬网站的一个页面:https://bbs.hupu.com/acg
要求使用多线程来并发爬取:范围是第一页的所有帖子,每个帖子包含标题、主题内容和第一页的所有回复内容。最后打印出爬到的所有帖子的标题。
这里不知道为什么代码出错。(应该是在ln4出错)
以及想知道什么时候才需要在select所在的句子后面加[0](比如ln4的第7行)?

关于并发结合BeautifulSoup进行爬虫时的问题!
- 写回答
- 好问题 0 提建议
- 关注问题
- 邀请回答
-
5条回答 默认 最新
- CSDN专家-showbo 2022-07-05 20:47关注
获得2.30元问题酬金 div下没有参数指定样式的元素,下标越界了,多线程爬太快了被网站拦截返回其他内容了吧。。
解决 1无用