qq_48077731 2021-12-16 22:44 采纳率: 75%
浏览 96
已结题

Pycharm爬取小说保存到txt with open路径错误

img

img


import requests
import re
import os
file_name='小说//'
if not os.path.exists(file_name):
os.mkdir(file_name)

headers={'User_Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.93 Safari/537.36 Edg/96.0.1054.53'}
response=requests.get('https://www.52bqg.net/110_110102/',headers=headers)

print(response.text)

html_date=re.findall('

https://ask.csdn.net/new
',response.text)

print(html_title)

print(html_data)

i=0
for book_url in html_date:
book_url='https://www.52bqg.net/110_110102/'+book_url+'.html'
# print(book_url)
book_response=requests.get(url=book_url,headers=headers)
# print(book_response.text)
boo_data=re.findall('

(.*?)
',book_response.text)
#print(boo_data)
book=re.sub('[(&nbsp)(

;;;;)(

;;;;)]','',boo_data[0])#替换乱码
# print(book)
with open(file_name+html_title[i]+'.txt','w')as f:
f.write(book)
i=i+1
print(html_title)

img

  • 写回答

1条回答 默认 最新

  • 陈年椰子 2021-12-16 23:07
    关注
    # print(book)
    print(file_name+html_title[i]+'.txt')  # 先确认你的文件名是否是你想要的名字
    with open(file_name+html_title[i]+'.txt','w')as f:
      f.write(book)
      i=i+1
    print(html_title)
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 12月25日
  • 已采纳回答 12月17日
  • 创建了问题 12月16日

悬赏问题

  • ¥15 配置FPT报错,该如何处理
  • ¥15 请大家看一下这个代码咋写,一点思路都没有,最好能做一下,不要伪代码,有偿
  • ¥15 有偿请人帮写个安卓系统下禁止装软件及禁止拷入文件的程序
  • ¥100 用 H.265 对音视频硬编码 (CUDA)
  • ¥20 mpich安装完成后出问题
  • ¥15 stm32循迹小车代码问题
  • ¥15 输入一堆单词,使其去重输出
  • ¥15 qc代码,修改和添加东西
  • ¥50 Unity的粒子系统使用shadergraph(内置管线)制作的一个顶点偏移shader,但是粒子模型移动时,顶点也会偏移
  • ¥15 如何用python处理excel的数据(极值标准化)