怎么提取下面这段代码中book_author里面的作者名称

import requests
from lxml import etree
import re

def parser():
    url = 'http://www.douban.com/tag/%E5%B0%8F%E8%AF%B4/?focus=book'
    headers = {'User-Agent': 'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT)'}
    html = requests.get(url=url,headers=headers).text
    tree = etree.HTML(html)
    book_list = tree.xpath('//div[@class="mod-list book-list"]/dl')
    print(book_list)
    with open('2.txt','w+',encoding='utf-8') as f:
        for dl in book_list:
            book_name = dl.xpath('./dd/a/text()')[0]
            book_author = dl.xpath('./dd/div/text()')[0]
            print(book_name,book_author)
            f.write(book_name+book_author)
            # f.write(+"\n")

if __name__ == '__main__':
    parser()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
PythonJavaC++go 2020-10-12 11:08
关注
代码那边不是有了吗？

book_author = dl.xpath('./dd/div/text()')[0] author = book_author.split("/")[0].strip()
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

详解Python的Django框架中inclusion_tag的使用
2020-09-21 21:21

### 详解Python的Django框架中`inclusion_tag`的使用 #### 一、引言在Django Web开发中，模板系统是非常重要的组成部分之一。它不仅提供了强大的数据展示功能，还支持各种复杂的逻辑处理。其中，`inclusion_tag`是...
python中attrs_与attrs告别Python中的样板
2020-07-09 04:02

cumj63710的博客 python中attrs Python是当今使用的最流行... 这个社区的原因是我们在Python软件包索引（PyPI）中拥有如此众多，种类繁多的软件包，以扩展和改进Python并解决不可避免的小问题。在本系列中，我们将研究七个PyPI库...
python函数能否增强代码可读性_python函数入门
2020-11-28 19:57

weixin_39731845的博客复用代码将可能重复执行的代码封装成函数，并在需要执行的地方调用函数，不仅可以实现代码的复用，还可以保持代码的一致性，便于日后的维护2.提高可读性使用函数可以提高代码的可读性，便于后期的代码维护，同时也...
python制作词云图代码_Python基于WordCloud制作词云图
2021-02-03 17:27

陈静静字椰蓉的博客这篇文章主要介绍了python基于WordCloud制作词云图,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下1. 导入需要的包packageimport matplotlib.pyplot as pltfrom...
Python中利用aiohttp制作异步爬虫及简单应用
2020-09-19 21:54

这段代码展示了如何使用 `requests` 库发起同步HTTP请求，并使用 `BeautifulSoup` 进行网页解析。最后，将爬取结果存储为CSV文件。 ##### 4.2 异步爬虫实现 ```python import time import aiohttp import asyncio ...
Python自动化查询【知网作者文献】(附完整代码)
2025-09-01 12:33

王伯安呢的博客本文介绍了一个使用Python自动查询知网作者文献的脚本工具。该工具通过requests库模拟网页请求实现四大功能：1)登录知网获取访问凭证；2)查询可申领文献；3)查看已认领文献；4)获取公开主页文献。核心功能包括处理...
Django中使用group_by的方法
2020-09-22 00:51

这段代码将返回一个包含作者和对应的书籍数量的列表，每个元素都是一个字典，如 `{'author': 'author_name', 'book_count': 3}`。如果你还需要对分组后的数据进行进一步过滤或排序，可以结合`filter()`、`order_by...
Python3， 33行代码搞了一个聊天机器人，这下再也不怕没人说话了。
2023-07-17 03:00

Carl_奕然的博客 Python制作聊天机器人 1、引言 2、实战 2.1 准备 2.2 介绍 2.2.1 NLTK 2.2.2 ChatterBot 2.3 安装 2.4 示例 2.4.1 创建聊天机器人 2.4.2 与用户交互 3、总结 1、引言小屌丝：鱼哥，看这段代码 from chatterbot ...
Python代码实际作用
2025-04-05 19:51

万能小贤哥的博客这段代码中，我们分别列出了菜谱需要的食材和已有的食材，然后通过列表推导式，找出在菜谱食材中但不在已有食材中的元素，这些元素就是我们需要去采购的食材。确定好要游览景点的坐标后，只需几行代码，就能得知各...
python爬虫；正则表达式爬虫
2023-05-31 14:45

总的来说，这段代码展示了如何使用Python的正则表达式和`requests`库进行简单的网页抓取。然而，对于复杂或大规模的爬虫项目，推荐结合`BeautifulSoup`和`Scrapy`框架，以提高代码的可维护性和效率。
Python Django完整教程与代码示例
2025-06-01 19:33

老胖闲聊的博客 Django是一个基于 Python 的高级Web 开发框架，遵循“MTV”（模型-模板-视图）设计模式（类似于 MVC）。它以高效、安全、可扩展著称，帮助开发者快速构建高质量的 Web 应用。# 字符字段，最大长度100# 作者字段，可...
python 树状图代码_利用Django模版生成树状结构实例代码
2020-12-09 22:42

weixin_39923137的博客 {% endfor %} """ return qs.filter(**kwargs) 接下来下面这段代码是树节点的模版代码。 {% load blog_tags %} {% load comments_tags %} {% query article_comments parent_comment=None as parent_comments %} {%...
python文档相似性比较代码_Python 比较文本相似性的方法(difflib,Levenshtein)
2020-12-14 14:15

weixin_39967598的博客 Python 比较文本相似性的方法(difflib,Levenshtein)最近工作需要用到序列匹配，检测相似性，不过有点复杂的是...其中，需要从input_and_output 中选取不固定长度的一段作为输入，且顺序不定，然后去与总体进行比较...
Python操纵Word神器——python-docx大全（含插入pptx图表）
2020-11-18 11:29

XerCis的博客文件的库 python-docx-template 是一款结合 python-docx 和 jinja2 的库，将 Word 模板文件和 jinja 标记结合使用，便于生成更多文档使用场景库创建文档 python-docx 修改文档 python-docx-template 安装 pip ...
python使用xpath提取数据_一文搞定Xpath简单高效的提取HTML数据
2020-12-04 04:41

weixin_40005454的博客 1.简介XPath是一门在 XML 文档中查找信息...2. 安装在Python中很多库都有提供Xpath的功能，但是最基本的还是lxml这个库，效率最高。在之前BeautifulSoup章节中我们也介绍到了lxml是如何安装的。pipinstalllxml3. 语...
Python基于Django框架图书管理系统.zip
2023-09-15 21:52

例如，图书管理系统可能包含Book、Author、Publisher等模型，每个模型对应数据库中的一个表，包含字段如书名、作者、出版社、出版日期等。 3. **视图（Views）**：视图是应用的业务逻辑部分，负责处理HTTP请求并...
Python+Selenium 如何使用execute_async_script的callback
2019-08-16 12:37

ngsb153的博客在我百度的时候，貌似关于execute_script的讲解不少，但是关于execute_async_script的讲解不是很多，还看到有文章在问callback为什么不能用（写在python里是肯定不能用的……）所以自己也写一篇关于execute_async_...
毕业设计：Python基于Django框架图书管理系统.zip
2023-10-12 16:58

例如，`Book`模型可能包含`title`（书名）、`author`（作者）、`publisher`（出版社）和`出版日期`等字段。通过模型，我们可以与数据库进行交互，如添加、更新或查询图书信息。其次，模板（Template）是用于呈现...
没有解决我的问题, 去提问

怎么提取下面这段代码中book_author里面的作者名称

2条回答 默认 最新

2条回答默认最新