oicp5541 2023-02-12 10:35 采纳率: 57.1%
浏览 33
已结题

如何使用xpath数据解析遇到的数据错位问题?

使用xpath数据解析遇到的数据错位问题?求提供解决方案
代码如下:

img

输出结果为:

img


原网页的内容为:

img


爬取的内容中:剧情和发行地内容明显错位问题
求解决

  • 写回答

2条回答 默认 最新

  • cjh4312 2023-02-12 12:35
    关注
    
    data=html.xpath('//*[@class="p-h el-col el-col-24 el-col-xs-9 el-col-sm-13 el-col-md-16"]')
    scores=html.xpath('//*[@class="score m-t-md m-b-n-sm"]//text()')
    for n,i in enumerate(data):
        name=i.xpath('./a//text()')
        print('电影名:',name[1])
        categories=i.xpath('./div/button')
        s=''
        for j in categories:
            dd=j.xpath('./span//text()')
            for k in dd:
                s=f"{s}{k} "
        print('剧情:',s)
        s=scores[n].replace('\n','')
        s=s.replace(' ','')
        print('评分:',s)
        info1=i.xpath('./div[2]')
        s=''
        for j in info1:
            dd=j.xpath('./span//text()')
            for k in dd:
                s=f"{s}{k} "
        print('发行地:',s)
        info2=i.xpath('./div[3]')
        for j in info2:
            dd=j.xpath('.//text()')
            if len(dd)>1:
                print(f"上映时间:{dd[1]} ")
        href=i.xpath('./a/@href')
        print('链接:',f"http://ssr1.scrape.center{href[0]}\n")
    

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 2月20日
  • 已采纳回答 2月12日
  • 创建了问题 2月12日

悬赏问题

  • ¥100 set_link_state
  • ¥15 虚幻5 UE美术毛发渲染
  • ¥15 CVRP 图论 物流运输优化
  • ¥15 Tableau online 嵌入ppt失败
  • ¥100 支付宝网页转账系统不识别账号
  • ¥15 基于单片机的靶位控制系统
  • ¥15 真我手机蓝牙传输进度消息被关闭了,怎么打开?(关键词-消息通知)
  • ¥15 装 pytorch 的时候出了好多问题,遇到这种情况怎么处理?
  • ¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
  • ¥15 手机接入宽带网线,如何释放宽带全部速度