Studying!!! 2020-05-10 16:26 采纳率: 100%
浏览 256

这个错误啥意思!求大佬帮忙

#爬取三国演义小说的所有章节和章节内容http://www.shicimingju.com/book/sanguoyanyi.html
import requests

from bs4 import BeautifulSoup

if name=='__main__':

    headers = {
    'User Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3947.100 Safari/537.36'
}
     url = 'http://www.shicimingju.com/book/sanguoyanyi.html'
     page_text = requests.get(url=url,headers=headers).text
     print(page_text)
#在首页中解析出章节的标题和详情页的url
#1.实例化对象,需要将页面源码数据加载到该对象中
     soup = BeautifulSoup(page_text,'lxml')
#解析章节标题和详情页url
     li_list = soup.select('.book-mulu >ul >li')
     fp = open('./sanguo.text','w',encoding='utf-8')
     for li in li_list:
           title = li.a.string
           detail_url = 'http://www.shicimingju.com'+li.a['herf']
    #对详情页发起请求,解析出章节内容
           detail_page_text = requests.get(url=detail_url,headers=headers).text
    #解析出详情页相关的章节内容
           detail_soup = BeautifulSoup(detail_page_text,'lxml')
           div_tag = detail_soup.find('div',class_='chapter_content')
           content = div_tag.text
           fp.write(title+':'+content+'\n')
           print(title,'爬取成功!!!')

            运行结果如下:
    <h1>Bad Message 400</h1><pre>reason: Illegal character 0x20</pre>
  • 写回答

1条回答 默认 最新

  • threenewbee 2020-05-10 19:19
    关注

    运行结果没看到,代码没有缩进
    无法调试
    建议你修改问题后再来帮你看

    评论

报告相同问题?

悬赏问题

  • ¥15 django5安装失败
  • ¥15 Java与Hbase相关问题
  • ¥15 ANSYS分析简单钎焊问题
  • ¥20 bash代码推送不上去 git fetch origin master #失败了
  • ¥15 LOL外服加入了反作弊系统,现在游戏录像rofl文件离线都无法打开
  • ¥15 在centos7安装conda
  • ¥15 c#调用yolo3 dll文件获取的数据对不上
  • ¥20 WPF 如何实现多语言,label 和cs(live Charts)中是否都能翻译
  • ¥15 STM32F103上电短路问题
  • ¥15 打开软件提示错误:failed to get wglChoosePixelFormatARB