weixin_63967673 2022-08-29 21:22 采纳率: 94.1%
浏览 42
已结题

Python爬虫运行直接进程已结束

问题遇到的现象和发生背景

为什么我写完爬虫,运行直接就进程已结束

问题相关代码,请勿粘贴截图
import urllib.request
def tieba_spider(url, begin_page, end_page):
    for page in range(begin_page, end_page + 1 ):
        pn = (page - 1) * 50
        file_name="第"+str(page)+"页.html"
        full_url=url+"&pn="+str(pn)
        html = load_papg(full_url, file_name)
        write_page(html,file_name)
def load_papg(url, filename):
    headers = {"User-Agent":"Mozilla/5.0 (compatible; MSIE 9.0; Windows NT6.1; Trident/5.0)"}
    request = urllib.request.Request(url, headers=headers)
    return urllib.request.urlopen(request).read()
def write_page(html,filename):
    print("正在保存:"+filename)
    with open(filename, 'w', encoding='utf-8') as file:
        file.write(html.decode('utf-8'))
if __name__=='__mian__':
    kw = input("请输入您需要爬取的网页");
    begin_page = int(input("请输入你需要爬取的首页数"));
    end_page = int(input("请输入你需要爬取的尾页数"));
    url = 'https://tieba.baidu.com/f?'
    key = urllib.parse.urlencode({"kw": kw})
    url = url+key
    tieba_spider(url, begin_page, end_page)


  • 写回答

1条回答 默认 最新

  • 快乐鹦鹉 2022-08-29 21:31
    关注
    
    if __name__ == '__main__':
    main写成mian了
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 9月6日
  • 已采纳回答 8月29日
  • 创建了问题 8月29日

悬赏问题

  • ¥15 ETLCloud 处理json多层级问题
  • ¥15 matlab中使用gurobi时报错
  • ¥15 这个主板怎么能扩出一两个sata口
  • ¥15 不是,这到底错哪儿了😭
  • ¥15 2020长安杯与连接网探
  • ¥15 关于#matlab#的问题:在模糊控制器中选出线路信息,在simulink中根据线路信息生成速度时间目标曲线(初速度为20m/s,15秒后减为0的速度时间图像)我想问线路信息是什么
  • ¥15 banner广告展示设置多少时间不怎么会消耗用户价值
  • ¥15 可见光定位matlab仿真
  • ¥15 arduino 四自由度机械臂
  • ¥15 wordpress 产品图片 GIF 没法显示