DragonOneBlue 2010-04-16 12:29
浏览 182
已采纳

nokogiri乱码问题~~~

先说说我的环境,win7, ror 2.3.5,ruby1.8.7,nokogiri 1.4

这是我的代码
[code="java"]
doc = Nokogiri::HTML.parse(open("http://www.soso.cn/"), nil, "gb2312")
@links = doc.css("a")
[/code]
获得的是乱码,然后这样
[code="java"]
doc = Nokogiri::HTML.parse(open("http://www.soso.cn/"))
@links = doc.css("a")
[/code]
也是乱码
我就换了几个utf-8编码的网站,还是乱码

只有http://www.huomo.cn/这个是正常的
用Iconv没用

我的页面charset=utf-8和charset=gb2312都已经试过了,还是不行

  • 写回答

1条回答 默认 最新

  • Hooopo 2010-04-16 13:18
    关注

    结果已经是正确的utf-8编码了,是你的控制台不能显示才乱码的。你可以试试把结果写到文件里看看。。

    再不用Iconv转换成gbk

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?