qq_48077731 2021-12-16 22:44 采纳率: 75%
浏览 91
已结题

Pycharm爬取小说保存到txt with open路径错误

img

img


import requests
import re
import os
file_name='小说//'
if not os.path.exists(file_name):
os.mkdir(file_name)

headers={'User_Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.93 Safari/537.36 Edg/96.0.1054.53'}
response=requests.get('https://www.52bqg.net/110_110102/',headers=headers)

print(response.text)

html_date=re.findall('

https://ask.csdn.net/new
',response.text)

print(html_title)

print(html_data)

i=0
for book_url in html_date:
book_url='https://www.52bqg.net/110_110102/'+book_url+'.html'
# print(book_url)
book_response=requests.get(url=book_url,headers=headers)
# print(book_response.text)
boo_data=re.findall('

(.*?)
',book_response.text)
#print(boo_data)
book=re.sub('[(&nbsp)(

;;;;)(

;;;;)]','',boo_data[0])#替换乱码
# print(book)
with open(file_name+html_title[i]+'.txt','w')as f:
f.write(book)
i=i+1
print(html_title)

img

  • 写回答

1条回答 默认 最新

  • 陈年椰子 2021-12-16 23:07
    关注
    # print(book)
    print(file_name+html_title[i]+'.txt')  # 先确认你的文件名是否是你想要的名字
    with open(file_name+html_title[i]+'.txt','w')as f:
      f.write(book)
      i=i+1
    print(html_title)
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 12月25日
  • 已采纳回答 12月17日
  • 创建了问题 12月16日

悬赏问题

  • ¥15 如何在scanpy上做差异基因和通路富集?
  • ¥20 关于#硬件工程#的问题,请各位专家解答!
  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?
  • ¥15 c++头文件不能识别CDialog