weixin_69932367 2023-06-07 16:29 采纳率: 83.3%
浏览 47
已结题

python爬虫问题类型


import re
for item in items:
    fn = re.sub(r'[?*\/|.:<>]', "", item['title'])#替换字符串中的匹配项
    with open(fn + '.txt', 'w', encoding='utf-8') as f:
        f.write('内容\n' + item['content'] + '\n\n\n')
  • 写回答

3条回答 默认 最新

  • 全栈若城 新星创作者: 编程技术技术领域 2023-06-07 16:48
    关注

    代码通过 re.sub() 方法对标题文本进行处理,将其中可能影响文件名的特殊字符(包括 ?*/\|.:<>)替换为空字符串,从而得到合法的文件名。
    使用 with open(fn + '.txt', 'w', encoding='utf-8') as f: 打开一个名为 fn.txt 的文件,并以写入模式打开。这里的 fn 是上一步处理后得到的文件名,.txt 是文件的扩展名。
    紧接着通过 f.write() 方法将标题和内容写入到文件中,多个内容之间使用三个换行符分隔开。
    当全部搜索结果遍历完成后,每个搜索结果 都会生成一个对应的 .txt 文件,每个文件中包含了该搜索结果的标题和内容。
    所以说 会生成多个 txt 的原因是因为你的 items

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 6月7日
  • 已采纳回答 6月7日
  • 创建了问题 6月7日