萌新求救，文件保存一部分后就报错？

import requests
from bs4 import BeautifulSoup
import os

url1 =' http://www.juda.cn'

def request(url):
    resp = requests.get(url)
    html = resp.content
    soup = BeautifulSoup(html,"lxml")
    # print(soup)
    return soup


def main(url):
    soup = request(url)
    lis = soup.find('div',class_="news_list").find_all('div',class_="text")

    #数据保存目录
    path = os.getcwd()+u'//爬取内容1//'
    if not os.path.exists(path):
        os.mkdir(path)
    #获取每篇文章的链接
    for i in lis:
        ff = i.find('div', class_="a_title").find_all('a', class_="size4-6p")
        for it in ff:
            link = url1 + it.get('href')

            #请求每篇文章
            result = request(link)
            title = result.find('section',class_="title_part").find('h1',class_="size1-9p").get_text()
            # print(title)
            paper = result.find('div',class_="all col-md-12").find_all('p')
            content = ''
            for p in paper:
                content += (p.text + '\n')
                # print(content)
            # 文章标题内容保存
            totlename = path + title +'.text'
            print(totlename)
            paper = open(totlename,'w',encoding='utf-8')
            paper.write('<<' + title + '>>\n\n')
            paper.write(content)
            paper.close()

if __name__ == '__main__':
    for i in range(1, 7):
        firsturl = 'http://www.juda.cn/search/index.html?keyword=%E4%B8%AD%E5%9B%BD%E9%93%81%E5%A1%94+%E6%A2%AF%E6%AC%A1%E7%94%B5%E6%B1%A0&type=news'
        url2 = firsturl + "&page=" + str(i)
        main(url2)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

6条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
天元浪子 Python领域优质创作者 2021-04-20 16:27
关注
题主抓到内容解析出来的title，有多个包含了/符号，比如“中国铁塔以0.68元/Wh价格收购电池梯次利用储能成本优势明显”。作为文件名，这是一个非法的符号，所以程序崩掉了。建议将这个/去掉或替换为其他字符，比如导入re模块，将第39行改为：

totlename = path + re.compile(r'/').sub('-', title) +'.text'

轻松写完全部文件。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(5条)

报告相同问题？

关注问题

萌新求救，文件保存一部分后就报错？ python 有问必答
2021-04-20 16:14

回答 6 已采纳题主抓到内容解析出来的title，有多个包含了/符号，比如“中国铁塔以0.68元/Wh价格收购电池梯次利用储能成本优势明显”。作为文件名，这是一个非法的符号，所以程序崩掉了。建议将这个/去掉或替换为
LeeCode21题合并有序链表报错？ python
2021-04-08 16:15

回答 1 已采纳你在自己电脑上面用的是链表吗？还是你讲list当做链表了？你看看lecode里面提示你的ListNode的数据结构，人家提供给你就是要求你用这个数据结构来完成，你这写法就没用到链表指针，都是list。
Python不会解决报错，求救！ python 有问必答
2021-07-08 01:13

回答 1 已采纳代码缩进不对。看看if和elif的缩进空格数一样吗？if外层代码的缩进正确吗？我知道了。因为你把elif nChoose==4: 分支中的 main() 注释掉了，导致这个分支没有代码块了。
苹果电脑python怎么下载模块_mac 上安装python的模块全部报错，求救？
2020-12-04 13:30

weixin_39843698的博客全部报同样一个错误错误的部分如下：File "/Users/Gino/anaconda/lib/python2.7/site-packages/distribute-0.6.28-py2.7.egg/setuptools/dist.py", line 257, in finalize_optionsep.require(installer=self....
python3 客户端上传文件至服务器后还原源文件 python
2022-03-13 15:57

回答 1 已采纳你是要自己写个文件传输协议嘛，还是用的ftp协议，直接用socket的话，按照你得逻辑，需要构造数据包了
成功安装opencv-python,但在python中调用cv2就报错，怎么解？ python
2021-01-06 14:34

回答 4 已采纳你的文件就命名成了cv2.py，冲突了，改成其他的吧
求救！python 读入文件，将其转存成UTF-8格式 python
2019-05-12 22:37

回答 3 已采纳 import chardet import argparse import os import codecs def get_encoding(file_name): f = open(
解决设置 logger 后 cmd 还是输出报错信息的问题
2022-04-24 03:27

白御空的博客解决设置 logger 后 cmd 还是输出报错信息的问题
数学建模萌新小白求救线性回归
2022-05-12 12:50

回答 1 已采纳聚类分析例程，你将X换成你的数据就可以用： %Matlab程序如下： X=[244.42 412.04 459.63 512.21 160.45 43.51 89.93
python选择求救 python 有问必答
2021-05-14 19:10

回答 2 已采纳 B是非法的，在元组中元素不能用赋值表达式。
Python求救，孩子不会写啊 python 有问必答
2021-06-10 15:10

回答 2 已采纳 import turtle turtle.left(180-180/3) turtle.forward(100) turtle.backward(10) turtle.right(90) turt
python查阅文献
2021-09-02 19:24

a useful man的博客工作原理一、找到sci-hub目前可用的域名二、对用户输入的论文地址进行解析，找到相应论文三、下载文献搜索对于广大学子来说真的是个麻烦事，如果你的学校购买的论文下载权限不够多，或者不在校园内，那就很头痛了...
大神求救，python python
2021-05-11 10:20

回答 2 已采纳把第一行删掉就行了
python3基础
2021-08-11 16:52

猫吃鱼の的博客 python3（与python2语法不一样）计算机常识软件：是一系列计算机指令，可以按照设计的逻辑完成某些业务。软件三要数：程序、数据、文档软件开发：就是显示按照功能逻辑实现代码的过程，需求分析、概要设计、...
python字符识别_Python 实现字符识别—Part2
2021-03-06 02:12

jkup192的博客如果你看的比较困惑的话，可以参考Python 实现字符识别—Part1：关于PIL库的使用http://www.jianshu.com/p/0a94d8ea2bf3Python 实现字符识别—Part2：关于图形格式的基础知识和我的一个问题(欢迎大神来指点迷津)...
python输入数组_python 3.5中如何用input输入多个数值？用什么分分隔开？还有函数中怎么把数组作为变量弄进去...
2020-11-23 14:42

weixin_39631953的博客求三元一次方程组用的cramer法则下面是用2.7写的代码defCOUNTT(A,B,C):returnA[0]*B[1]*C[2]+B[0]*C[1]*A[2]+C[0]*A[1]*B[2]-C[0]*B[1]*A[2]-B[0]*A[1]*C[2]-A[0]*C[1]*B[2]M=[0]*3N=...求三元一次方程组用的cramer...
python基础汇总（四）
2018-12-03 22:49

weixin_30881367的博客今天我们来讲一讲正则表达式与json，这些知识将涉及到WEB开发和爬虫开发等等一系列项目。我在学习的过程中，发现一个不错的网站，也是一个比较知名的网站，就是菜鸟教程：http://www.runoob.com 这个网站的知识点...
python全栈开发 * mysql数据类型 * 180829
2019-09-29 05:24

aug38165的博客 show databases1.information_schema: 虚拟库，不占用磁盘空间，存储的是数据库启动后的一些参数，如用户表信息、列信息、权限信息、字符信息等2.performance_schema: MySQL 5.5开始新增一个数据库：主要用于收集...
安装Anaconda详细教程，conda中安装带有CUDA的Pytorch，踩坑烂尾了求拯救！
2020-08-21 23:54

Amiyai的博客一、安装Anaconda（安装时加入环境变量版） 1.1 下载下载地址：https://www.anaconda.com/download/ 1.2 安装步骤 1.2.1 关闭杀毒软件，单击next 1.2.2 阅读许可条款，然后单击“I Agree” 1.2.3选择安装到的用户...
python 全栈开发，Day61(库的操作,表的操作,数据类型,数据类型(2),完整性约束)
2018-06-12 15:24

shykevin的博客 python 全栈开发，Day61(库的操作,表的操作,数据类型,数据类型(2),完整性约束) 昨日内容回顾一、回顾定义：mysql就是一个基于socket编写的C / S架构的软件包含： ---服务端软件 - ...
没有解决我的问题, 去提问

悬赏问题

¥88 找成都本地经验丰富懂小程序开发的技术大咖
¥15 如何处理复杂数据表格的除法运算
¥15 如何用stc8h1k08的片子做485数据透传的功能？(关键词-串口)
¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗？
¥200 uniapp长期运行卡死问题解决
¥15 请教：如何用postman调用本地虚拟机区块链接上的合约？
¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题：[h264 @ 000000004faf7500]no frame？
¥15 乘性高斯噪声在深度学习网络中的应用
¥15 关于docker部署flink集成hadoop的yarn，请教个问题 flink启动yarn-session.sh连不上hadoop，这个整了好几天一直不行，求帮忙看一下怎么解决
¥15 深度学习根据CNN网络模型，搭建BP模型并训练MNIST数据集

萌新求救，文件保存一部分后就报错？

6条回答 默认 最新

悬赏问题

6条回答默认最新