dtqjbbr5283 2012-09-20 15:04
浏览 25
已采纳

去xml解组

Is there a way to extract the source of an image in an HTML file using only one struct (with encode/xml)? Now I have something like this

type XML struct {
    A Image `xml:"div>img"`
}

type Image struct {
    I string `xml:"src,attr"`
}

And would be great to only declare something like this :

type Image struct {
    I string `xml:"div>img,src,attr"`
}

This is the HTML :

<div><div><img src="hello.png"/></div></div>
  • 写回答

1条回答 默认 最新

  • dongyi8795 2012-10-05 00:16
    关注

    Seems that a good way is to use the exp/html package, like this:

    package main
    
    import (
        "exp/html"
        "strings"
    )
    
    func main() {
        a, _ := html.Parse(strings.NewReader(testString))
        println(a.FirstChild.FirstChild.NextSibling.FirstChild.FirstChild.FirstChild.Attr[0].Val)
    }
    
    var testString = `<div><div><img src="hello.png"/></div></div>`
    

    All this FirstChild and NextSibling are needed because exp/html constructs a "correct" html5 tree so this code is actually parsing this:

    <html>
        <head></head>
        <body>
            <div>
                <div>
                    <img src="hello.png"/>
                </div>
            </div>
        </body>
    </html>
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
  • ¥15 (希望可以解决问题)ma和mb文件无法正常打开,打开后是空白,但是有正常内存占用,但可以在打开Maya应用程序后打开场景ma和mb格式。
  • ¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
  • ¥20 腾讯企业邮箱邮件可以恢复么
  • ¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗?
  • ¥15 错误 LNK2001 无法解析的外部符号
  • ¥50 安装pyaudiokits失败
  • ¥15 计组这些题应该咋做呀
  • ¥60 更换迈创SOL6M4AE卡的时候,驱动要重新装才能使用,怎么解决?
  • ¥15 让node服务器有自动加载文件的功能