import re
for item in items:
fn = re.sub(r'[?*\/|.:<>]', "", item['title'])#替换字符串中的匹配项
with open(fn + '.txt', 'w', encoding='utf-8') as f:
f.write('内容\n' + item['content'] + '\n\n\n')
python爬虫问题类型
- 写回答
- 好问题 0 提建议
- 关注问题
- 邀请回答
-
3条回答 默认 最新
关注代码通过
re.sub()方法对标题文本进行处理,将其中可能影响文件名的特殊字符(包括?*/\|.:<>)替换为空字符串,从而得到合法的文件名。
使用with open(fn + '.txt', 'w', encoding='utf-8') as f:打开一个名为fn.txt的文件,并以写入模式打开。这里的fn是上一步处理后得到的文件名,.txt是文件的扩展名。
紧接着通过f.write()方法将标题和内容写入到文件中,多个内容之间使用三个换行符分隔开。
当全部搜索结果遍历完成后,每个搜索结果 都会生成一个对应的.txt文件,每个文件中包含了该搜索结果的标题和内容。
所以说 会生成多个 txt 的原因是因为你的 items本回答被题主选为最佳回答 , 对您是否有帮助呢?评论 打赏 举报解决 1无用