nyarurato 2022-04-06 14:17 采纳率: 20%
浏览 95
已结题

python的xpath问题

pycahrm打印时出错,无法用xpath后面加text()将内容打印下来

import requests
from lxml import etree
url = "http://finance.sina.com.cn/zl/china/2022-04-06/zl-imcwipii2061261.shtml"
header = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.84 Safari/537.36',
'Host':'finance.sina.com.cn'
}
X = requests.get(url=url,headers=header)
X1 = X.content.decode('utf8')

result = etree.HTML(X1)

divresult = result.xpath('//div[@class="recommendCont"]//div[@class="rcdTopRigt"]/text()')[0]
divresults = etree.tostring(divresult,encoding='utf8').decode('utf8')
print(divresults)

divresults = etree.tostring(divresult,encoding='utf8').decode('utf8')
File "src\lxml\etree.pyx", line 3460, in lxml.etree.tostring
TypeError: Type 'lxml.etree._ElementUnicodeResult' cannot be serialized.

不知道为什么出现这个错误,希望能够给解答下

  • 写回答

4条回答 默认 最新

  • CSDN专家-showbo 2022-04-06 14:32
    关注

    img

    img

    import requests
    from lxml import etree
    url = "http://finance.sina.com.cn/zl/china/2022-04-06/zl-imcwipii2061261.shtml"
    header = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.84 Safari/537.36'
    }
    X = requests.get(url=url,headers=header)
    X1 = X.content.decode('utf-8')
    
    result = etree.HTML(X1)
    
    divresult = result.xpath('//div[@class="recommendCont"]//div[@class="rcdTopRigt"]//text()')#[0]
    print(divresult)
    
    
    

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(3条)

报告相同问题?

问题事件

  • 系统已结题 4月14日
  • 已采纳回答 4月6日
  • 创建了问题 4月6日

悬赏问题

  • ¥15 wpf dategrid表头排序图标自定义
  • ¥15 分析下图所示同步时序逻辑电路的逻辑功能。
  • ¥15 halcon联合c#遇到了问题不能解决
  • ¥15 xshell无法连接提示ssh服务器拒绝密码
  • ¥15 AT89C52单片机C语言关于串口通信的位操作
  • ¥20 需要步骤截图(标签-服务器|关键词-map)
  • ¥50 gki vendor hook
  • ¥15 灰狼算法和蚁群算法如何结合
  • ¥15 这是一个利用ESP32自带按键和LED控制的录像代码,编译过程出现问题,请解决并且指出错误,指导如何处理 ,协助完成代码并上传代码
  • ¥20 stm32f103,hal库 hal_usart_receive函数接收不到数据。