zerone_pr 2020-04-13 16:28 采纳率: 33.3%
浏览 239

为何towxml解析微信公众号文章出现乱码?

在小程序中使用towxml解析时,Markdown能够正常解析,但解析HTML时,头部和尾部会出现部分乱码。

尤其是解析公众号文章时出现全部乱码。

下方分别是 解析Markdown、解析普通html、解析公众号所显示的页面

图片说明图片说明图片说明

求大佬指教这是怎么一回事?

  • 写回答

1条回答 默认 最新

  • lshen01 2023-03-17 01:06
    关注

    参考GPT和自己的思路:

    对于你提出的问题,我认为可能存在以下几种情况:

    1. towxml对HTML的解析不够完善,导致某些标签或属性没有被正确解析,从而导致出现乱码。

    2. 公众号文章中可能存在一些不规范的HTML标签或属性,从而导致towxml解析出错,进而导致出现乱码。

    3. towxml的配置可能需要进一步优化,例如增加指定编码方式的选项等。

    建议你联系towxml的开发者了解更多详细信息,并升级至最新版本,同时也可以查看towxml的文档和GitHub问题页以获得更多解决方案。

    评论

报告相同问题?

悬赏问题

  • ¥15 对于相关问题的求解与代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
  • ¥15 保护模式-系统加载-段寄存器
  • ¥15 电脑桌面设定一个区域禁止鼠标操作
  • ¥15 求NPF226060磁芯的详细资料
  • ¥15 使用R语言marginaleffects包进行边际效应图绘制
  • ¥20 usb设备兼容性问题
  • ¥15 错误(10048): “调用exui内部功能”库命令的参数“参数4”不能接受空数据。怎么解决啊
  • ¥15 安装svn网络有问题怎么办