꧁༺溟ི༒娘ོ༻꧂ 2022-09-28 15:00 采纳率: 100%
浏览 14
已结题

python|爬出来的小说不换行

我爬的小说-正文又不换行了,哭唧唧o(╥﹏╥)o 求帮帮忙

import requests
from bs4 import BeautifulSoup
import os
path = os.getcwd()
passage = 0
url = "https://www.hdrmjgj.com/37/37804/78081218.html"
endurl ="https://www.hdrmjgj.com/37/37804/78688343.html"
head = {}
head['user-Agent'] = 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36 SE 2.X MetaSr 1.0'
while True:
    r = requests.get(url, headers=head)
    r.encoding = r.apparent_encoding
    soup = BeautifulSoup(r.text, "html.parser")
    #标题
    title = soup.select("#main > div > div > div.bookname > h1")[0].get_text()
    #正文
    text = soup.select("#content")[0].get_text()
    with open(path + "\\亲手养大的纸片人要娶我.txt", 'a', encoding='utf-8') as f:
        for i in title:
            f.write(i)
        f.write("\n")
        for x in text:
            f.write(x)
    passage+=1
    nexturl = "https://www.hdrmjgj.com" + soup.select("#main > div > div > div.bookname > div.bottem1 > a.next")[0]['href']
    url = nexturl
    print(str(title) + "下载成功")
    if(url==endurl):
        break
os.system("pause")

我现在爬出来是这样的

img

我想要他爬出来是这样的

img

  • 写回答

1条回答 默认 最新

  • honestman_ 2022-09-28 15:11
    关注

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 10月16日
  • 已采纳回答 10月8日
  • 创建了问题 9月28日

悬赏问题

  • ¥15 spss统计中二分类变量和有序变量的相关性分析可以用kendall相关分析吗?
  • ¥15 拟通过pc下指令到安卓系统,如果追求响应速度,尽可能无延迟,是不是用安卓模拟器会优于实体的安卓手机?如果是,可以快多少毫秒?
  • ¥20 神经网络Sequential name=sequential, built=False
  • ¥16 Qphython 用xlrd读取excel报错
  • ¥15 单片机学习顺序问题!!
  • ¥15 ikuai客户端多拨vpn,重启总是有个别重拨不上
  • ¥20 关于#anlogic#sdram#的问题,如何解决?(关键词-performance)
  • ¥15 相敏解调 matlab
  • ¥15 求lingo代码和思路
  • ¥15 公交车和无人机协同运输