duanpang2751 2016-08-31 05:42
浏览 30
已采纳

ISO-8859-1编码网站中的Umlauts

My very simple code snippet:

import "net/http"
import "io"
import "os"

func main() {
  resp, err := http.Get("http://example.com")
  if err == nil {
    io.Copy(os.Stdout, resp.Body)
  }
}

When example.com is charset=iso-8859-1 encoded my output is faulty. Umlauts for example are not displayed correctly:

Hällo Wörld --> H?llo W?rld

Whats a good solution to display umlauts correctly??

  • 写回答

1条回答 默认 最新

  • dongxun1244 2016-08-31 08:01
    关注

    You can use the package golang.org/x/net/html/charset to determine the encoding of the website, and also create a reader that converts the content to UTF-8.

    Below is a working example:

    package main
    
    import (
        "io"
        "net/http"
        "os"
    
        "golang.org/x/net/html/charset"
    )
    
    func main() {
        resp, err := http.Get("http://example.com")
        if err != nil {
            os.Exit(1)
        }
    
        r, err := charset.NewReader(resp.Body, resp.Header.Get("Content-Type"))
        if err != nil {
            os.Exit(1)
        }
    
        io.Copy(os.Stdout, r)
    }
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 求帮我调试一下freefem代码
  • ¥15 R语言Rstudio突然无法启动
  • ¥15 关于#matlab#的问题:提取2个图像的变量作为另外一个图像像元的移动量,计算新的位置创建新的图像并提取第二个图像的变量到新的图像
  • ¥15 改算法,照着压缩包里边,参考其他代码封装的格式 写到main函数里
  • ¥15 用windows做服务的同志有吗
  • ¥60 求一个简单的网页(标签-安全|关键词-上传)
  • ¥35 lstm时间序列共享单车预测,loss值优化,参数优化算法
  • ¥15 Python中的request,如何使用ssr节点,通过代理requests网页。本人在泰国,需要用大陆ip才能玩网页游戏,合法合规。
  • ¥100 为什么这个恒流源电路不能恒流?
  • ¥15 有偿求跨组件数据流路径图