我想爬网站的一个页面:https://bbs.hupu.com/acg
要求使用多线程来并发爬取:范围是第一页的所有帖子,每个帖子包含标题、主题内容和第一页的所有回复内容。最后打印出爬到的所有帖子的标题。
这里不知道为什么代码出错。(应该是在ln4出错)
以及想知道什么时候才需要在select所在的句子后面加[0](比如ln4的第7行)?


我想爬网站的一个页面:https://bbs.hupu.com/acg
要求使用多线程来并发爬取:范围是第一页的所有帖子,每个帖子包含标题、主题内容和第一页的所有回复内容。最后打印出爬到的所有帖子的标题。
这里不知道为什么代码出错。(应该是在ln4出错)
以及想知道什么时候才需要在select所在的句子后面加[0](比如ln4的第7行)?


div下没有参数指定样式的元素,下标越界了,多线程爬太快了被网站拦截返回其他内容了吧。。
