dongxing5525 2015-10-17 08:44
浏览 53
已采纳

如何在html上获取所有元素的名称(我的错误代码运行循环)

I want to get a document tree. Then, first, I displayed all elements name. But my code run loop. How can I do?

package main

import (
    "github.com/PuerkitoBio/goquery"
    "golang.org/x/net/html"
)

func getTagName(s *goquery.Selection) {
    for _, n := range s.Nodes {
        if n.Type != html.ElementNode {
            continue
        }
        println(n.Data)
        getTagName(s.Children())
    }
}

func main() {
    doc, _ := goquery.NewDocument("https://news.ycombinator.com/")
    doc.Find("html body").Each(func(_ int, s *goquery.Selection) {
        getTagName(s)
    })
}
  • 写回答

1条回答 默认 最新

  • duanhoupeng6642 2015-10-17 11:05
    关注

    It seems to work with this:

    package main
    
    import (
        "os"
    
        "github.com/PuerkitoBio/goquery"
        "golang.org/x/net/html"
    )
    
    var areWeLooping = make(map[*goquery.Selection]struct{})
    
    func getTagName(s *goquery.Selection) {
        if _, weAreLooping := areWeLooping[s]; weAreLooping {
            println("loop detected")
            os.Exit(1)
        }
    
        areWeLooping[s] = struct{}{}
    
        for _, n := range s.Nodes {
            if n.Type != html.ElementNode {
                continue
            }
            println(n.Data)
        }
    
        s.Children().Each(func(_ int, s *goquery.Selection) {
            getTagName(s)
        })
    }
    
    func main() {
        doc, _ := goquery.NewDocument("https://news.ycombinator.com/")
        doc.Find("html body").Children().Each(func(_ int, s *goquery.Selection) {
            getTagName(s)
        })
    }
    

    Having getTagName(s.Children()) inside the loop was causing trouble.

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥30 Matlab打开默认名称带有/的光谱数据
  • ¥50 easyExcel模板 动态单元格合并列
  • ¥15 res.rows如何取值使用
  • ¥15 在odoo17开发环境中,怎么实现库存管理系统,或独立模块设计与AGV小车对接?开发方面应如何设计和开发?请详细解释MES或WMS在与AGV小车对接时需完成的设计和开发
  • ¥15 CSP算法实现EEG特征提取,哪一步错了?
  • ¥15 游戏盾如何溯源服务器真实ip?需要30个字。后面的字是凑数的
  • ¥15 vue3前端取消收藏的不会引用collectId
  • ¥15 delphi7 HMAC_SHA256方式加密
  • ¥15 关于#qt#的问题:我想实现qcustomplot完成坐标轴
  • ¥15 下列c语言代码为何输出了多余的空格