从天而降的拳 2021-02-24 12:18 采纳率: 100%
浏览 62
已结题

新手学习python爬虫,爬取小说的时候,中间调试,使用print打印DIV的时候不会打印

import requests
import re  # 内库 ,标准库

# 规范 类需要跟上一行程序空两行
class NovelSpider:

    def __init__(self):
        self.session = requests.Session()  # 下载器

    def get_novel(self, url):  # 添加URL参数,为了使能够方便下载任意一个小说
        # 下载小说
        # 下载小说的首页面的html
        index_html = self.download(url, encoding='gbk')

        # 提取章节信息,url 网址
        novel_chapter_infos = self.get_chapter_infos(index_html)

        # 下载章节信息
    def download(self, url, encoding):
        # 下载html源码
        response = self.session.get(url)
        response.encoding = encoding
        html = response.text
        return html

    def get_chapter_infos(self, index_html):
        """提取章节信息"""
        div = re.findall(r'<DIV class="clearfix dirconone">.*?</DIV>', index_html, re.S)
        print(div)


if __name__ == '_main_':
    novel_url = 'https://wwwquanshu.92kaifa.com/book/5/718/'
    spider = NovelSpider()  # 面向对象实例化
    spider.get_novel(novel_url)

"D:\py paper\Scripts\python.exe" "D:/python/py paper/NovelSpider.py"

进程已结束,退出代码0

  • 写回答

2条回答 默认 最新

  • 多鱼的夏天 2021-02-24 15:36
    关注

    32行代码不正确,应该改为 if __name__ == '__main__':

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 11月29日
  • 已采纳回答 11月21日

悬赏问题

  • ¥60 版本过低apk如何修改可以兼容新的安卓系统
  • ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
  • ¥50 有数据,怎么建立模型求影响全要素生产率的因素
  • ¥50 有数据,怎么用matlab求全要素生产率
  • ¥15 TI的insta-spin例程
  • ¥15 完成下列问题完成下列问题
  • ¥15 C#算法问题, 不知道怎么处理这个数据的转换
  • ¥15 YoloV5 第三方库的版本对照问题
  • ¥15 请完成下列相关问题!
  • ¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像,如何解决?