如何提取XML这里的东西？

python爬取58同城的数据，得到的结果房价和面积被加密，通过百度知道它的形成过程
和原来的破解过程，但是现在有了一点点小变动，我想如何提取这段name和code
的值，求教！！!! 图片说明
我想把map name对应的值和其code的值如何提取出来。
在FontTools.ttLib里面好像没有提取map的函数吧？
之前代码：

import base64
from io import BytesIO
from fontTools.ttLib import TTFont
import requests
import re
from lxml import etree


for i in range(1,3):
    url = 'https://sz.58.com/zufang/pn'+str(i)
    res = requests.get(url)
    #print(res.text)
    bs64_str = re.findall("charset=utf-8;base64,(.*?)'\)", res.text)[0]
    bin_data = base64.decodebytes(bs64_str.encode())
    with open('test'+str(i)+'.otf','wb') as f:
        f.write(bin_data)
    font = TTFont(BytesIO(bin_data))
    font.saveXML('test'+str(i)+'.xml')
    uniList = font['glyf'].keys()
    c = font['cmap'].tables[0].ttFont.tables['cmap'].tables[0].cmap

    结果为{38006: 'glyph00005', 38287: 'glyph00007', 39228: 'glyph00004', 39499: 'glyph00003', 40506: 'glyph00010', 40611: 'glyph00006', 40804: 'glyph00009', 40850: 'glyph00001', 40868: 'glyph00002', 40869: 'glyph00008'}
{38006: 'glyph00009', 38287: 'glyph00003', 39228: 'glyph00005', 39499: 'glyph00001', 40506: 'glyph00006', 40611: 'glyph00002', 40804: 'glyph00010', 40850: 'glyph00008', 40868: 'glyph00004', 40869: 'glyph00007'}

所以我如何提取图片中map name和code所对应的值？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
ivan_prajak 2019-08-05 09:54
关注
from lxml import etree

parser = etree.HTMLParser(encoding="utf-8")
xml = etree.parse('test1.xml',parser=parser) # etree加载本地XML文件,以第1个为例('test1.xml')
name_list = xml.xpath('//cmap//map/@name') # 获取name值
code_list = xml.xpath('//cmap//map/@code') # 获取code值
code_list = [int(i, 16) for i in code_list] # code值16进制转10进制

print(dict(zip(code_list, name_list)))

望采纳!

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

如何提取XML这里的东西？数据挖掘
2019-08-04 02:25

回答 1 已采纳 from lxml import etree parser = etree.HTMLParser(encoding="utf-8") xml = etree.parse('test1.xml'
如何从xml文件中提取特定字段？ xml
2019-08-02 14:46

回答 1 已采纳 package main import ( "encoding/xml" "fmt" ) const data = `<?xml version="1.0" encodi
shell或者python脚本提取xml文件中信息 bash xml 有问必答
2022-03-05 19:19

回答 3 已采纳将test.xml文件放在xml-info.py的同一目录下，运行如下代码即可： import argparse from lxml import etree parser=argparse.Argu
什么？不会人工智能也想训练模型？
2021-11-10 01:54

望向天空的恒毅的博客因为这学期有人工智能的课，然后呢也有个像自己弄个小模型出来。在跟某研二师兄的交流中，他叫我去团队跑下模型做个对比实验，顺便带着发个paper。我心想：我在机器学习领域，属于纯小白～试试吧！然后再开始了...
import标签只能导入xml文件吗? spring
2021-04-19 15:23

回答 2 已采纳你这样写是错误的,如果你要导入properties配置文件的话你可以这样写 <context:property-placeholder location="classpath:jdbc.pro
idea的maven项目pom.xml文件爆红？ intellij-idea java maven
2022-03-30 18:33

回答 1 已采纳看图标是pom文件被误认为是Ant配置了。 idea的pom.xml文件中所有的标签都报错_斌斌_____的博客-CSDN博客_idea pom 文件报错
使用PHP从xml文件中提取模式？ php xml
2016-02-11 09:31

回答 3 已采纳 You could try this, it basically just loops through each line of the file and finds whatever is be
voc(xml)标签查询种类并打印
2022-09-16 15:20

define_mine的博客 circuit', 'short', 'spurious_copper','spur']#这里是需要提取的类别 matrix=[0,0,0,0,0,0] def save_annotation(file): tree = ET.parse(ann_filepath + '/' + file) root = tree.getroot() result = root.findall...
flask怎么传递xml文件? flask 前端后端
2022-06-18 18:19

回答 1 已采纳 https://blog.csdn.net/qq_43295373/article/details/112005510参考这个
如何进行XML解析？ xml
2018-09-21 10:56

回答 1 已采纳 You need to improve your xml struct tags, it's kind a tricky for newcomers how to parse xml, here
如何从xml（包括标签）中提取完整的html？ xml
2018-09-27 03:41

回答 1 已采纳 From the Docs If the XML element contains character data, that data is accumulated in the fi
云计算、大数据、人工智能傻傻分不清楚？本文详解这三者的关系
2022-06-17 22:10

冰露可乐的博客所以一般在一个云计算平台上，云、大数据、人工智能都能找得到。 2）infrastructure as a service IaaS，platform as a service PaaS，software as a service SaaS 3）笔试求AC，可以不考虑空间复杂度，但是面试既要...
c# 如何获取XML节点中的值？ c# xml
2020-07-15 11:15

回答 1 已采纳 xmlDoc=new XmlDocument(); xmlDoc.Load(你的文件); XmlNode node=xmlDoc.SelectSingleNode("task"); XmlEl
大数据和人工智能有关系吗？
2019-05-25 21:59

000000000000000000生活的博客如果我感觉不出它那边是人还是机器，那它就真的是一个人工智能的东西了。 2 让机器学会推理怎么才能做到这一点呢？人们就想：我首先要告诉计算机人类的推理的能力。你看人重要的是什么？人和动物的区别在什么...
2023年最新人工智能入门指南（学习清单）
2023-03-01 20:51

努力改掉拖延症的小白的博客 ChatGPT最近很火，为了帮助想入门人工智能的小伙伴们准备了一份超详细的学习清单
没有解决我的问题, 去提问

悬赏问题

¥15 如何在scanpy上做差异基因和通路富集？
¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？
¥15 c++头文件不能识别CDialog

如何提取XML这里的东西？

1条回答 默认 最新

悬赏问题

1条回答默认最新