qq_43831985 2020-10-12 09:31 采纳率: 0%
浏览 115
已采纳

怎么提取下面这段代码中book_author里面的作者名称

import requests
from lxml import etree
import re

def parser():
    url = 'http://www.douban.com/tag/%E5%B0%8F%E8%AF%B4/?focus=book'
    headers = {'User-Agent': 'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT)'}
    html = requests.get(url=url,headers=headers).text
    tree = etree.HTML(html)
    book_list = tree.xpath('//div[@class="mod-list book-list"]/dl')
    print(book_list)
    with open('2.txt','w+',encoding='utf-8') as f:
        for dl in book_list:
            book_name = dl.xpath('./dd/a/text()')[0]
            book_author = dl.xpath('./dd/div/text()')[0]
            print(book_name,book_author)
            f.write(book_name+book_author)
            # f.write(+"\n")

if __name__ == '__main__':
    parser()
  • 写回答

2条回答 默认 最新

  • PythonJavaC++go 2020-10-12 11:08
    关注
        代码那边不是有了吗?
    
            book_author = dl.xpath('./dd/div/text()')[0]
            author = book_author.split("/")[0].strip()
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 delta降尺度计算的一些细节,有偿
  • ¥15 Arduino红外遥控代码有问题
  • ¥15 数值计算离散正交多项式
  • ¥30 数值计算均差系数编程
  • ¥15 redis-full-check比较 两个集群的数据出错
  • ¥15 Matlab编程问题
  • ¥15 训练的多模态特征融合模型准确度很低怎么办
  • ¥15 kylin启动报错log4j类冲突
  • ¥15 超声波模块测距控制点灯,灯的闪烁很不稳定,经过调试发现测的距离偏大
  • ¥15 import arcpy出现importing _arcgisscripting 找不到相关程序