入门cn的烦恼,请求帮我看一下

import requests
import re
main_url = 'https://www.qb5.tw/book_116663/'
main_html = requests.get(main_url).text
info_list = re.findall('（.*?）</dd', main_html)
for inf in info_list:
    url = 'https://www.qb5.tw/book_116663/'+inf[0]
    response = requests.get(url)
    html_date = response.text
    text = re.findall('(.*?)
', html_date)[0]
    text = text.replace(' 全本小说 www.qb5.tw，最快更新<a,href="https://www.qb5.tw/book_116663/50916243.html>星门</a>最新章节！<br><br>'</span>, <span class="hljs-string">'')
    text = text.replace(' ', ' ')
    text = inf[1]+'\n\n'+text.replace('
', '\n')
    print(text)
    open('星门.txt', mode='a', encoding='gbk').write(text)

帮我试试看看这段代码什么问题，为什么得不到我想要的东西呀

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

cjh4312 2023-01-18 20:52

关注

剩下的你自己慢慢处理吧


import requests
import re
from lxml import etree
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'
}
main_url = 'https://www.qb5.tw/book_116663/'
main_html = requests.get(main_url,headers=headers).text
info_list = re.findall('<dd><a href="(.*?)">第', main_html)
for inf in info_list:
    print(inf)
    if len(inf)!=13:
        continue
    url = f'https://www.qb5.tw/book_116663/{inf}'
    response = requests.get(url,headers=headers)
    html_date = response.text
   
    html = etree.HTML(html_date)
    sen_list = html.xpath('//*[@id="content"]//text()')
    text=''
    for i in sen_list:
        print(i)
    break

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

报告相同问题？

关注问题

SGLang编译器机制揭秘：DSL简化编程实战入门必看
2026-01-11 11:12

LikYu-餘力的博客本文介绍了SGLang-v0.5.6镜像，这是一个专为大语言模型推理优化的框架。在星图GPU平台上，用户可以自动化部署该镜像，快速搭建高性能推理环境。其核心应用场景是简化复杂LLM程序的开发，例如通过其DSL前端轻松实现多...
自然语言处理 NLP 从入门到精通
2025-01-13 09:38

莲华君的博客这本书的结构从基础的自然语言处理概念到复杂的深度学习模型，再到工程化实现和实际案例，逐步引导读者掌握NLP的核心技术，并能够在实际工作中应用。每一章都注重实际操作，结合具体的编程实例与项目，实现理论与...
为什么我建议你学习一下 Go 语言？
2021-07-13 14:15

leoay的博客之前想了好久不知道要写啥，其实之前有一篇文章已经写了一半，但是觉得不好，就束之高阁了，本来想写一个从零开始的 Go 语言的系列文章，但是觉得没有必要，因为零基础的参考资料太多了。最后，我决定还是写我当前...
Python 编程入门指南：轻松上手，毫不费力！
2025-09-15 18:32

想成为高手499的博客你可能以为，这个过程会非常复杂，要安装一堆东西，要配置很多设置，但是放松，Python ...通过简单的几行代码，你就能从一个巨大的数据集里提取出你需要的洞察，而这些操作用其他编程语言可能需要好几倍的时间和精力。
Python入门：Python3 requests模块全面学习教程
2025-09-15 15:20

xcLeigh的博客 Python入门：Python requests模块全面学习教程，本文是围绕该模块的使用展开，其作为第三方 HTTP 请求库，因 API 简洁、功能完善，比标准库 urllib 更易用，是爬虫、接口测试等场景的首选工具。教程先介绍基础准备，...
Python入门：Python3 循环语句全面学习教程
2025-08-01 14:01

xcLeigh的博客 Python入门：Python3 循环语句全面学习教程，本文详细解析了 Python3 的循环语句，包括 while 和 for 两种类型及相关控制语句。while 循环基于条件重复执行，介绍了基本语法、计算 1 到 100 总和实例、无限循环、与 ...
Python入门：Python3 logging模块全面学习教程
2025-09-16 11:38

xcLeigh的博客前言 Python作为一门简洁、易读、功能强大的编程语言，其基础语法是入门学习的核心。掌握好基础语法，能为后续的编程实践打下坚实的基础。本文将全面讲解Python3的基础语法知识，适合编程初学者系统学习。Python以...
java多线程编程从入门到卓越(超详细总结）
2020-04-11 13:49

轻松玩编程的博客有些编程语言采用这种模型。状态切换的常用方法 void setPriority(int newPriotity)方法：设置线程的优先级。 int getPriority()方法：获取线程的优先级。最低优先级1（MIN_PRIORITY) 最高优先级10(MAX_PRIORITY) ...
Python爬虫实战：一键下载百度文库文档，告别付费烦恼！
2025-04-12 17:24

编程咕咕gu-的博客百度文库虽说是个宝藏网站，可惜大部分好内容都要付费下载。不过作为一名程序员，用爬虫手艺就能解决这个小问题。...或扫描下方CSDN官方微信二维码获娶Python入门&进阶全套学习资料、电子书、软件包、项目源码
开发者入门必看：SGLang推理框架一键部署镜像使用指南
2026-01-05 02:56

郁林成森的博客本文介绍了如何在星图GPU平台上一键自动化部署SGLang-v0.5.6镜像，快速搭建大语言模型推理环境。该镜像预装了SGLang框架，开发者可轻松启动高性能推理服务，用于实现复杂的多轮对话、任务规划及结构化文本生成等应用...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月18日

入门cn的烦恼,请求帮我看一下

1条回答 默认 最新

问题事件

1条回答默认最新