zenghonghao 2016-02-16 16:21 采纳率: 36.4%
浏览 1418

htmlparser抓取url的时候,含有中文字符抛出异常

我明确的看了网站的编码是gb2312,并且有设置
parser.setEncoding("gb2312");
但是最后抛出这个异常
Exception in thread "main" java.lang.IllegalArgumentException
原因是我的url里面含有中文,不知道该怎么结局诶

  • 写回答

3条回答

  • Exploring1024 2016-02-17 00:40
    关注

    这个可能是htmlparser的弊端吧!还有好几种比较不错的解析html,比如Jsoup工具也不错

    评论

报告相同问题?

悬赏问题

  • ¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
  • ¥15 (希望可以解决问题)ma和mb文件无法正常打开,打开后是空白,但是有正常内存占用,但可以在打开Maya应用程序后打开场景ma和mb格式。
  • ¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
  • ¥20 腾讯企业邮箱邮件可以恢复么
  • ¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗?
  • ¥15 错误 LNK2001 无法解析的外部符号
  • ¥50 安装pyaudiokits失败
  • ¥15 计组这些题应该咋做呀
  • ¥60 更换迈创SOL6M4AE卡的时候,驱动要重新装才能使用,怎么解决?
  • ¥15 让node服务器有自动加载文件的功能