登录
首页 >  Golang >  Go问答

解析嵌套在 XML 的 HTML 内容

来源:stackoverflow

时间:2024-03-08 13:24:25 447浏览 收藏

你在学习Golang相关的知识吗?本文《解析嵌套在 XML 的 HTML 内容》,主要介绍的内容就涉及到,如果你想提升自己的开发能力,就不要错过这篇文章,大家要知道编程理论基础和实战操作都是不可或缺的哦!

问题内容

我从第 3 方收到一个 xml 文件,该文件的其中一个 xml 标记中有一个 html 元素。我不知道如何解组它以获取 href url。

xml 示例:


  
  google

这是我到目前为止所得到的,但没有向结构中添加任何内容:

type Href struct {
    Link string `xml:"href"`
}
type Link struct {
    URL []Href `xml:"a"`
}
type XmlFile struct {
    HTMLTag []Link `xml:"SOME_HTML"`
}

myFile := []byte(`

    
    google
`)

var output XmlFile
err := xml.Unmarshal(myFile, &output)
fmt.Println(output) // {[]}

解决方案


你可以这样做(https://play.golang.org/p/MJzAVLBFfms):

type aelement struct {
    href string `xml:"href,attr"`
}

type content struct {
    a aelement `xml:"a"`
}

func main() {
    test := `google`

    var result content
    if err := xml.unmarshal([]byte(test), &result); err != nil {
        log.fatal(err)
    }
    fmt.println(result)
}

解析 xml 中的所有内容,假设 html 或其他标记中可能有多个 a 标记(例如 div)。

如果不需要,只需将 xmlfile.links 替换为 xmlfile.link 类型的 link (不是 []link

func main() {
    type Link struct {
        XMLName xml.Name `xml:"a"`
        URL     string   `xml:"href,attr"`
        Target  string   `xml:"target,attr"`
        Content string   `xml:",chardata"`
    }
    type Div struct {
        XMLName xml.Name `xml:"div"`
        Classes string   `xml:"class,attr"`
        Content string   `xml:",chardata"`
    }
    type XmlFile struct {
        XMLName xml.Name `xml:"SOME_HTML"`
        Links   []Link   `xml:"a"`
        Divs    []Div    `xml:"div"`
    }

    myFile := []byte(`

    google
    facebook
    
text
`) var output XmlFile err := xml.Unmarshal(myFile, &output) if err != nil { log.Fatal(err) } fmt.Println(output) }

Playground

编辑:在 xml 中添加更多标签以显示如何解析不同的标签类型。

以上就是本文的全部内容了,是否有顺利帮助你解决问题?若是能给你带来学习上的帮助,请大家多多支持golang学习网!更多关于Golang的相关知识,也可关注golang学习网公众号。

声明:本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>