登录
首页 >  Golang >  Go问答

去除所有 XML 文本的空格

来源:stackoverflow

时间:2024-03-22 11:18:35 150浏览 收藏

为了去除 XML 字符串中每个元素的空格,可以使用 `encoding/xml` 包中的 `xml.TokenReader` 原语。此方法通过实现 `xml.TokenReader` 接口,并用一个包装器函数 `trimmer` 修剪文本节点的前导和尾随空白,来动态修改 XML 流。`xml.NewTokenDecoder` 可将 `trimmer` 转换为常规解码器,从而实现 XML 数据的修剪和解码。

问题内容

我正在从我无法控制的外部 Web 服务中检索 XML 字符串。一些数据包含空格 我有前导空格 。如何修剪 XML 字符串中每个元素的空格?


解决方案


您可以使用encoding/xml 包中的原语来动态修改xml 流。在这种情况下,实现 xml.TokenReader 是一个简单的解决方案:

import (
    "bytes"
    "encoding/xml"
)

type trimmer struct {
    dec *xml.decoder
}

func (tr trimmer) token() (xml.token, error) {
    t, err := tr.dec.token()
    if cd, ok := t.(xml.chardata); ok {
        t = xml.chardata(bytes.trimspace(cd))
    }
    return t, err
}

trimmer 包装底层解码器并返回修改后的令牌流。 xml.chardata 表示文本节点。每当遇到一个时,就会调用 bytes.TrimSpace 来修剪前导和尾随空白。所有其他令牌均未经修改地返回。

xml.NewTokenDecodertrimmer 转回常规解码器:

import (
    "encoding/xml"
    "fmt"
    "io"
    "log"
)

var r io.reader                          // data source
raw := xml.newdecoder(r)                 // regular decoder
dec := xml.newtokendecoder(trimmer{raw}) // trimming decoder

var v mytype
err := dec.decode(&v)

这可能很容易不起作用,具体取决于数据的外观,但如果数据是可预测的并且不会在 xml 标记之外的任何地方包含 >,您可以这样做:

https://play.golang.org/p/4YSpvLFwHjZ

package main

import (
  "fmt"
  "regexp"
)

func main() {
  r := regexp.MustCompile(">(\\s*)")
  xml := "   hello  There!"
  xml = r.ReplaceAllString(xml, ">")
  fmt.Println(xml)
}

好了,本文到此结束,带大家了解了《去除所有 XML 文本的空格》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多Golang知识!

声明:本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>