能看看我这组代码该怎么改吗？

import requests
from lxml import etree
import asyncio
import aiohttp
import aiofiles
import os
def get_url(url):
resp=requests.get(url)
resp.encoding="utf-8"
resp_text=resp.text
result=[]
tree=etree.HTML(resp_text)
trss=tree.xpath('//div[@class="mulu"]/center/table')
for tab in trss:
chapter={}
trs=tab.xpath('./tr')
title=trs[0].xpath(".//text()")
titles="".join(title).strip()
hrefs_list=[]
for tr in trs[1:]:
href=tr.xpath('./td/a/@href')
hrefs_list.extend(href)
chapter['titles']=titles
chapter['hrefs_list']=hrefs_list
result.append(chapter)
async def download_chapter(name,hrefs):
if not os.path.exists(name):
os.makedirs(name)
tasks=[]
for href in hrefs:
t=asyncio.create_task(download_one(name,hrefs))
tasks.append(t)
await asyncio.wait(tasks)
async def download_one(name,href):
async with aiohttp.ClientSession()as session:
async with session.get(href)as resp:
page_source =await resp.text(encoding='utf-8')
tree=etree.HTML(page_source)
title_name = tree.xpath('/html/body/div[3]/h1/text()')[0].strip()
content="\n".join(tree.xpath('/html/body/div[3]/div[2]/p//text()'))
async with aiofiles.open(f"{name}/{title_name}.txt",mode="w",encoding="utf-8")as f:
await f.write(content)
print(title_name,"下载完成")

def main():
url ="https://www.mingchaonaxieshier.com/%22
chapters=get_url(url)
for chapter in chapters:
titles=chapter['titles']
hrefs_list=chapter['hrefs_list']
asyncio.run(download_chapter(titles,hrefs_list))

if name == 'main':
main()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

技术专家团-辉煌仪奇 2022-03-25 15:27

关注

import asyncio
import os

import aiofiles
import aiohttp
import requests
from lxml import etree


def get_url(url):
    resp = requests.get(url)
    resp.encoding = "utf-8"
    resp_text = resp.text
    result = []
    tree = etree.HTML(resp_text)
    trss = tree.xpath('//div[@class="mulu"]/center/table')
    for tab in trss:
        chapter = {}
        trs = tab.xpath('./tr')
        title = trs[0].xpath(".//text()")
        titles = "".join(title).strip()
    hrefs_list = []
    for tr in trs[1:]:
        href = tr.xpath('./td/a/@href')
        hrefs_list.extend(href)
        chapter['titles'] = titles
        chapter['hrefs_list'] = hrefs_list
        result.append(chapter)
    return  result


async def download_chapter(name,hrefs):
    if not os.path.exists(name):
        os.makedirs(name)
    tasks = []
    for href in hrefs:
        t = asyncio.create_task(download_one(name,href))
        tasks.append(t)
    await asyncio.wait(tasks)


async def download_one(name,href):
    async with aiohttp.ClientSession() as session:
        async with session.get(href) as resp:
            page_source = await resp.text(encoding = 'utf-8')
            tree = etree.HTML(page_source)
            title_name = tree.xpath('/html/body/div[3]/h1/text()')[0].strip()
            content = "\n".join(tree.xpath('/html/body/div[3]/div[2]/p//text()'))
    async with aiofiles.open(f"{name}/{title_name}.txt",mode = "w",encoding = "utf-8") as f:
        await f.write(content)
    print(title_name,"下载完成")


def main():
    url = "https://www.mingchaonaxieshier.com/%22"


    chapters = get_url(url)
    for chapter in chapters:
        titles = chapter['titles']
    hrefs_list = chapter['hrefs_list']
    asyncio.run(download_chapter(titles,hrefs_list))

if __name__ == '__main__':

    main()

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(2条)

报告相同问题？

关注问题

能看看我这组代码该怎么改吗？ python 有问必答
2022-03-25 15:11

回答 3 已采纳 import asyncio import os import aiofiles import aiohttp import requests from lxml import etree de
Python 运行时间久了，def中的部分代码不执行，但是可以显示结果 python
2023-02-26 19:32

回答 7 已采纳 1、检查get_all_labels 函数2、你使用了下面的语句，如果if条件状态不是200，语句没有任何处理，所以只要不是200就没下文了。print_label没有返回值，while无法开启下次循
用matplotlib的monthlocator()绘制的月度时间横坐标如何修改？ python
2022-08-01 12:31

回答 6 已采纳把下列代码换成里面的代码试试：ax.xaxis.set_major_locator(MonthLocator())ax.xaxis.set_major_formatter(DateFormatter(
如何看懂python代码分几步_不会Python吗？几分钟看完资深程序员给你的Python入门指南...
2020-12-21 06:45

weixin_39848097的博客究竟怎么入门成了大家关心的问题，虽然网络上有众多python入门教程，但是看得越多发现入门越难。最终看了很多文章，却仍没跨过新手那道门槛。那么结合自身的学习经验以及参考许多自学者的学习经验，整理出一条可操作...
关于#python#的题目，请各位专家解答！ c语言 java python 有问必答
2021-10-06 18:48

回答 1 已采纳 9 class class1(): def __init__(self,num): self.num=num def function1(self): r
python 转换json时错误，提示在文中 json python
2021-07-31 23:20

回答 2 已采纳 res = requests.get('https://openapi.cheyun.com/article/41534') json_data = json.loads(res.text)
深度强化学习code python pytorch 神经网络
2022-12-26 19:08

回答 1 已采纳望采纳！点击该回答右侧的“采纳”按钮即可采纳！！！你可以尝试分别寻找各个部分的源代码，并修改参数后组装在一起使用。不过，你需要先了解代码的基本结构和工作原理，才能进行组装。你可以尝试先读懂代码的每一
代码看不懂？ChatGPT 帮你解释，详细到爆！
2023-03-05 21:00

生信宝典的博客偷个懒，用ChatGPT 帮我写段生物信息代码如果 ChatGPT 给出的的代码不太完善，如何请他一步步改好？网上看到一段代码，不知道是什么含义？输入 ChatGPT 帮我们解释下。生信宝典 1: 下面是一段 Linux 代码，请帮我...
ptthon词云图最简单的结果 python
2023-01-09 18:01

回答 3 已采纳
并行多线程失败，怎么弄 python
2022-08-22 15:00

回答 3 已采纳这是多进程而不是多线程从19行到34行，不应该在for循环体内，应该与for循环平级，否则就是在不断地创建和销毁进程池，结果啥也干不成进程数原则上是CPU核数的整数倍，不过倒也不必受此约束，主要看计算
X has 2 features per sample; python 大数据机器学习
2022-07-29 13:43

回答 1 已采纳 plt.contourf绘制的图是基于其中某两个特征的，需要重新构建分类器，并且选择数据集其中的某两个特征，代码以前两个特征为例，即代码中的0: 2，PS：由于代码太长，我就不一一复制了，从195行开
蓝桥杯 Python B组省一必备知识清单
2022-06-04 15:52

荷碧TongZJ的博客 2022 年省赛：我估计 48.5 分左右 (满分 150)。广东总共 78 个省一，我只排到了第 33 (42.3%)2022 年国赛：最后...我将从“知识预备”、“刷题网站”、“函数模板”三个方面为大家讲解怎样准备蓝桥杯 Python 组的比赛。
终于体会到程序员的痛苦——查找错误&细节优化 python 问答团队
2022-06-16 13:03

回答 2 已采纳恭喜楼主，贺喜楼主！
用 Python 做石头剪刀布，看谁能赢过谁？
2022-06-09 18:00

AI科技大本营的博客作者 | 云朵君来源 | 数据STUDIO最近有粉丝朋友聊到用Python做个石头剪刀布的小游戏。我一寻思，还挺好玩。其实游戏编程是学习如何编程的一个好方法，它会使用许多我们在现实世界中看到的工具，还可以玩一个游戏来...
python代码实现论文〖文献引用顺序〗修改校对
2022-08-26 17:02

白鳯的博客 python代码实现论文〖文献引用顺序〗修改校对文章目录 python代码实现论文〖文献引用顺序〗修改校对问题描述解决思路代码实现 1、需要的库 2、读取word文档得到每个段落的内容 3、获取文献映射表 4、输出需要...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月25日

悬赏问题

¥20 西门子S7-Graph,S7-300，梯形图
¥50 用易语言http 访问不了网页
¥50 safari浏览器fetch提交数据后数据丢失问题
¥15 matlab不知道怎么改，求解答！！
¥15 永磁直线电机的电流环pi调不出来
¥15 用stata实现聚类的代码
¥15 请问paddlehub能支持移动端开发吗？在Android studio上该如何部署？
¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效
¥15 悬赏！微信开发者工具报错，求帮改

能看看我这组代码该怎么改吗？

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新