weixin_63967673 2022-08-29 21:22 采纳率: 94.1%
浏览 46
已结题

Python爬虫运行直接进程已结束

问题遇到的现象和发生背景

为什么我写完爬虫,运行直接就进程已结束

问题相关代码,请勿粘贴截图
import urllib.request
def tieba_spider(url, begin_page, end_page):
    for page in range(begin_page, end_page + 1 ):
        pn = (page - 1) * 50
        file_name="第"+str(page)+"页.html"
        full_url=url+"&pn="+str(pn)
        html = load_papg(full_url, file_name)
        write_page(html,file_name)
def load_papg(url, filename):
    headers = {"User-Agent":"Mozilla/5.0 (compatible; MSIE 9.0; Windows NT6.1; Trident/5.0)"}
    request = urllib.request.Request(url, headers=headers)
    return urllib.request.urlopen(request).read()
def write_page(html,filename):
    print("正在保存:"+filename)
    with open(filename, 'w', encoding='utf-8') as file:
        file.write(html.decode('utf-8'))
if __name__=='__mian__':
    kw = input("请输入您需要爬取的网页");
    begin_page = int(input("请输入你需要爬取的首页数"));
    end_page = int(input("请输入你需要爬取的尾页数"));
    url = 'https://tieba.baidu.com/f?'
    key = urllib.parse.urlencode({"kw": kw})
    url = url+key
    tieba_spider(url, begin_page, end_page)


  • 写回答

1条回答 默认 最新

  • 快乐鹦鹉 2022-08-29 21:31
    关注
    
    if __name__ == '__main__':
    main写成mian了
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 9月6日
  • 已采纳回答 8月29日
  • 创建了问题 8月29日

悬赏问题

  • ¥15 latex投稿显示click download
  • ¥15 请问读取环境变量文件失败是什么原因?
  • ¥15 在若依框架下实现人脸识别
  • ¥15 网络科学导论,网络控制
  • ¥100 安卓tv程序连接SQLSERVER2008问题
  • ¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比,为什么Snetinel-2计算的结果最小值特别小,而Lansat8就很平均
  • ¥15 metadata提取的PDF元数据,如何转换为一个Excel
  • ¥15 关于arduino编程toCharArray()函数的使用
  • ¥100 vc++混合CEF采用CLR方式编译报错
  • ¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误,如何解决?