爬取猫眼票房数字编码问题，请教解码

我在爬取猫眼票房的时候，网站对数字进行了编码
页面显示的数字：2047.87
JS文件显示的内容：.

JS文件将字符串进行了HTML实体编码，请教一下，如果才能翻译成正常的数字

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2024-06-10 21:47
关注
以下内容由CHATGPT及阿里嘎多学长共同生成、有用望采纳：

根据你提供的信息，JS文件中的HTML实体编码采用了Unicode编码的形式，即&#xXXXX;，其中XXXX是十六进制的Unicode码点。要将这些编码转换为正常的数字，首先需要将这些十六进制的码点转换为十进制，然后根据转换结果进行相应的解码。

以下是解码的步骤：

将每个&#xXXXX;中的XXXX转换为十进制数。
将转换得到的十进制数转换为对应的字符。
将得到的字符组合起来，形成原始的数字字符串。

具体到你的例子：

 对应的十进制是 58124，转换为字符是 '2'。
 对应的十进制是 63398，转换为字符是 '0'。
 对应的十进制是 54006，转换为字符是 '4'。
 对应的十进制是 60466，转换为字符是 '7'。
 和上面的相同，也是 '7'。
 再次出现，同样是 '2'。

组合起来就是 "2047.87"。

如果你需要在Python中实现这个解码过程，可以使用以下代码：

html_entities = ["", "", "", "", ".", "", ""] decoded_number = "" for entity in html_entities: if entity.startswith("&#x"): # 提取十六进制数并转换为十进制 char_code = int(entity[3:-1], 16) # 将字符码转换为字符并添加到结果字符串 decoded_number += chr(char_code) else: # 如果不是编码形式，直接添加 decoded_number += entity print(decoded_number) # 输出: 2047.87

关于参考资料，你可以参考以下网页，它们提供了HTML实体编码和解码的工具和信息：

[HTML编码解码 - 在线工具大全]^1^
[HTML实体编码]^2^
[Html编码解码 - 工具匠]^3^
[在线Html实体编码解码-HTML Entity Encoding/Decoding]^4^
[HTML 编码/解码—LZL在线工具]^5^
[HTML实体编码/解码 | RAKKOTOOLS - ラッコツールズ]^6^
[HTML Entity Encoding/Decoding· 开发者工具箱]^7^
[HTML 实体编码 - 解码 - Simple Tools]^10^

这些工具和网页可以帮助你更好地理解HTML实体编码和解码的过程，并提供了在线工具来转换编码。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

java怎样爬取猫眼票房数据 java
2017-11-13 06:31

回答 8 已采纳他是用的 font-family: stonefont; 这个字体。具体啥字体不重要。你解析他的字符串。 . 这个看着是乱码。实际 java能读出来 "\uE
python猫眼实时电影消息爬取问题 python 有问必答
2021-11-21 20:31

回答 1 已采纳信息在movieList.data.list下，直接获取就行了 import requests headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0
怎么爬取猫眼电影里的所有城市信息，不要selenium的 python
2019-01-14 20:49

回答 2 已采纳 1.通过网页加载后的代码，可以找到城市信息 ``` 阿拉善盟 ``` 2.通过查找js-city-name等关键词，可发现城市信息是由https://s0.meituan.net/
Python爬取猫眼票房榜信息和用户评论及用户信息
2024-10-07 16:12

Python爬取猫眼票房榜信息和用户评论及用户信息
爬取猫眼电影top100所有海报图片到本地的images文件夹下 python 有问必答
2021-10-24 15:40

回答 2 已采纳首先根据页面网址变化，构造出网址列表：urls=[f'https://maoyan.com/board/4?offset={i}' for i in range(0,100,10)]在用request
python爬取猫眼top写入excel 提示string index out of range？ list python
2021-04-07 23:47

回答 2 已采纳明显跑到那里时超限了，data里元素数量肯定不到五个，输出一下看看data具体是什么就知道了，问题应该是你get_one_page(）里，你解析出来的数据有一组是特殊的，不到五个
提取豆瓣网和猫眼的数据 python
2021-12-07 22:51

回答 1 已采纳图表部分建议使用pychart，联动numpy及pandas进行数据处理的时候pychart的表格比较美观一些，如果有条件的话使用power BI也可以，这些在答辩上对维护和优化方面可以多拿些分吧，毕
Python爬取猫眼电影票房 + 数据可视化
2024-04-18 07:00

ZShiJ的博客接着我们就可以对于猫眼电影票房数据进行爬取了，比如上座率、场均人次、票房占比、电影名称、上映时间、综合票房、排片场次和排片占比等。接着我们想要进行数据抓包，就要看网站的具体内容，通过按F12，我们可以...
关于#分布式#的问题，如何解决？ idea spring cloud 分布式
2022-08-08 11:38

回答 1 已采纳 springCloudAlibaba简单demo框架_不脱发的宝宝的博客-CSDN博客_springcloudalibaba框架此dem
我的代码有什么问题？ python
2021-08-09 16:26

回答 2 已采纳 print(response)看看网页请求返回值
爬虫猫眼查看不同性别，不同城市，不同学历，对电影的选择是否存在什么偏向 python 有问必答
2022-01-04 15:09

回答 2 已采纳题主的问题分两个方面，首先要写个爬虫程序获取大量数据，然后对数据分析，简单点就是分类求和，复杂点用回归分析。
python爬虫阶段性总结和项目实操——爬取猫眼票房Top100
2021-08-09 16:24

jmu-stu的博客本博客通过爬取猫眼票房Top100来简要复习一下网页的HTML获取（requests库）解析（Beautiful Soup库）和数据保存（csv库）以及总结一下爬取过程中遇到的问题和解决方法运行结果如下 1.获取网页源代码 def get_one_...
类似于猫眼电影的https://m.maoyan.com/mmdb/comments/movie/1217402.json?_v_=yes&offset=1的json文件是如何获取的？ json 前端有问必答爬虫
2022-04-25 12:56

回答 2 已采纳 http://m.maoyan.com/mmdb/comments/movie/1218029.json?v=yes&offset=0 这里简单的分析一下参数的含义：1218029：猫眼电影的ID（
Python爬取猫眼电影票房数据公开爬虫源码案例.zip
2024-04-30 15:38

python爬虫案例源码，python爬虫学习，python爬虫案例，python爬取在线网站数据，python爬取网站数据，python数据分析，数据获取，项目实战，python爬虫小例子，python爬虫代码示例，python爬虫简单示例，python爬虫...
猫眼专业版票房信息获取Python版
2023-03-02 14:57

2023年猫眼实时票房的接口信息存在加密的情况，一般的方法无法直接获取到它的值，需要通过Js逆向去分析它接口信息的实现方法，从而找到合适的方法去破解它。本代码完成了接口破解的部分，并含有接口破解的教程，...
爬取猫眼票房数并数据可视化
2021-02-05 17:09

捉鸭子的博客 isSplit=true，去掉接口后你会发现就是字体加密反爬的猫眼专业版，数据就是json格式我们就利用json模块进行抓取这个网页数据存入csv做数据可视化我们先发送请求获取数据 class Maoyan(object): # 初始化数据 def...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 7月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月10日

悬赏问题

¥66 换电脑后应用程序报错
¥50 array数据同步问题
¥15 pic16F877a单片机的外部触发中断程序仿真失效
¥15 Matlab插值拟合差分微分规划图论
¥15 keil5 target not created
¥15 C/C++数据与算法请教
¥15 怎么找志同道合的伙伴
¥20 如何让程序ab.eXe自已删除干净硬盘里的本文件自己的ab.eXe文件
¥50 爬虫预算充足，跪巨佬
¥15 滑块验证码拖动问题悬赏

爬取猫眼票房数字编码问题，请教解码

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新