麒麟木木 2017-11-15 06:36 采纳率: 25%
浏览 2635

Java中Selenium+PhantomJS抓取网页乱码

在Java中使用Selenium操作phantomJS驱动去抓取界面,在调用webDriver.get("URL")
某个界面之后,使用webDriver.getPageSource()得到这个界面的字符串中文是乱码,比如这样子:<!-- 代码ä¸ä¸åº”使用ID,否则会在页面ä¸å‡ºçŽ°é‡å¤id -->。不知道怎么解决,求大神指点。

  • 写回答

1条回答 默认 最新

  • AriaSulD 2017-11-15 06:54
    关注
      new String(对象.getBytes("ios8859-1"),"utf-8")
    
    评论

报告相同问题?

悬赏问题

  • ¥50 汇编语言除法溢出问题
  • ¥65 C++实现删除N个数据列表共有的元素
  • ¥15 Visual Studio问题
  • ¥15 state显示变量是字符串形式,但是仍然红色,无法引用,并显示类型不匹配
  • ¥20 求一个html代码,有偿
  • ¥100 关于使用MATLAB中copularnd函数的问题
  • ¥20 在虚拟机的pycharm上
  • ¥15 jupyterthemes 设置完毕后没有效果
  • ¥15 matlab图像高斯低通滤波
  • ¥15 针对曲面部件的制孔路径规划,大家有什么思路吗