go 标准库 `encoding/xml` 在解析包含同名但不同命名空间(特别是默认命名空间)的 xml 元素时,存在固有挑战,如 `` 和 `
我们的目标是能够从
直观上,我们可能会尝试使用如下的 Go 结构体来解析上述 XML:
package main
import (
"encoding/xml"
"fmt"
)
type Rss struct {
XMLName xml.Name `xml:"rss"`
Items []Item `xml:"channel>item"`
}
type Item struct {
Link string `xml:"link"` // 期望匹配
AtomLink AtomLink `xml:"https://www./link/b2fdb4e6edcd80ed0c1620ddf6ff5389 link"` // 期望匹配
}
type AtomLink struct {
Href string `xml:"href,attr"`
}
func main() {
xmlData := `
-
http://stackoverflow.com/rss
Item description
`
var rss Rss
err := xml.Unmarshal([]byte(xmlData), &rss)
if err != nil {
fmt.Println("Unmarshal error:", err)
return
}
if len(rss.Items) > 0 {
fmt.Printf("Item Link: %s\n", rss.Items[0].Link)
fmt.Printf("Item AtomLink Href: %s\n", rss.Items[0].AtomLink.Href)
}
}然而,尝试运行上述代码会导致一个冲突错误:
Unmarshal error: main.Item field "Link" with tag "link" conflicts with field "AtomLink" with tag "https://www./link/b2fdb4e6edcd80ed0c1620ddf6ff5389 link"
这个错误表明 encoding/xml 包无法区分 Item 结构体中的 Link 字段(标签为 link)和 AtomLink 字段(标签为 https://www./link/b2fdb4e6edcd80ed0c1620ddf6ff5389 link),因为它们在 Go 的内部处理中被视为冲突的。尽管我们通过命名空间 URL 明确指定了 AtomLink,但对于 encoding/xml 而言,当存在同名元素时,它倾向于避免这种潜在的歧义。
更进一步,即使我们选择只解析其中一个,例如只保留 Link 字段而注释掉 AtomLink 字段:
type Item struct {
Link string `xml:"link"` // 期望匹配
// AtomLink AtomLink `xml:"https://www./link/b2fdb4e6edcd80ed0c1620ddf6ff5389 link"`
}在这种情况下,xml:"link" 标签并不会像我们直觉认为的那样,只匹配无命名空间的 元素。相反,它会匹配任何命名空间下的 元素。如果 XML 中存在
鉴于 encoding/xml 的这些特性,我们需要采用一些变通方案来成功解析此类 XML。
如果我们的需求是明确只获取某个特定命名空间下的链接(例如,只关心 atom:link),并且可以忽略无命名空间的 ,那么可以直接将结构体定义为只匹配该特定元素:
package main
import (
"encoding/xml"
"fmt"
)
type Rss struct {
XMLName xml.Name `xml:"rss"`
Items []Item `xml:"channel>item"`
}
type Item struct {
// 仅解析 Atom 命名空间下的 link 元素
AtomLink AtomLink `xml:"https://www./link/b2fdb4e6edcd80ed0c1620ddf6ff5389 link"`
}
type AtomLink struct {
Href string `xml:"href,attr"`
}
func main() {
xmlData := `
-
http://stackoverflow.com/rss
Item description
`
var rss Rss
err := xml.Unmarshal([]byte(xmlData), &rss)
if err != nil {
fmt.Println("Unmarshal error:", err)
return
}
if len(rss.Items) > 0 {
fmt.Printf("Item AtomLink Href: %s\n", rss.Items[0].AtomLink.Href)
// Output: Item AtomLink Href: https://www./link/7d08c3cfc1bc6c0ca31c8fa6d89aa0f1
}
}优点:直接、精确,避免了冲突。 缺点:如果 XML 中不存在该特定元素,或者业务需求同时需要无命名空间的同名元素,此方法则不适用。
更通用和健壮的方法是,将所有同名的 元素(无论它们是否带有命名空间前缀)解析到一个字符串切片中。然后,我们可以根据业务逻辑或元素的出现顺序,从切片中筛选出我们真正需要的链接。
package main
import (
"encoding/xml"
"fmt"
"strings"
)
type Rss struct {
XMLName xml.Name `xml:"rss"`
Items []Item `xml:"channel>item"`
}
type Item struct {
// 收集所有名为 "link" 的元素内容
Links []string `xml:"link"`
// 单独解析 Atom 命名空间下的 link 的 href 属性
AtomLink AtomLink `xml:"https://www./link/b2fdb4e6edcd80ed0c1620ddf6ff5389 link"`
}
type AtomLink struct {
Href string `xml:"href,attr"`
}
func main() {
xmlData := `
-
http://stackoverflow.com/rss
Item description
`
var rss Rss
err := xml.Unmarshal([]byte(xmlData), &rss)
if err != nil {
fmt.Println("Unmarshal error:", err)
return
}
if len(rss.Items) > 0 {
item := rss.Items[0]
// 筛选出无命名空间的 link
var defaultLink string
for _, l := range item.Links {
if l != "" && !strings.Contains(l, "https://www./link/b2fdb4e6edcd80ed0c1620ddf6ff5389
") { // 简单判断,更严谨需根据XML结构判断
defaultLink = l
break
}
}
fmt.Printf("Item Default Link: %s\n", defaultLink) // 期望: http://stackoverflow.com/rss
fmt.Printf("Item AtomLink Href: %s\n", item.AtomLink.Href) // 期望: https://www./link/7d08c3cfc1bc6c0ca31c8fa6d89aa0f1
}
}代码解析:
优点:
encoding/xml 包在处理包含同名但不同命名空间(特别是默认命名空间)的 XML 元素时,确实存在一些挑战。理想的结构体定义可能会导致冲突错误,而默认的标签匹配行为也可能不符合预期。通过本文介绍的两种变通方案——唯一选择特定命名空间的元素或收集所有同名元素并进行筛选——开发者可以有效地应对这些问题。在实际开发中,理解这些特性和局限性,并根据具体需求选择最合适的解析策略,是确保 XML 数据正确解组的关键。
# go
# ai
# overflow
# 标准库
# 命名空间
# xml
# 字符串
# 结构体
# 接口
# 切片
# href
# http
# atom
# 自定义
# 的是
# 第一个
# 两种
# 遍历
# 所需
# 也可
# 更高
# 此类
# 可以直接
相关文章:
ppt制作免费网站有哪些,ppt模板免费下载网站?
建站之星备案流程有哪些注意事项?
矢量图网站制作软件,用千图网的一张矢量图做公司app首页,该网站并未说明版权等问题,这样做算不算侵权?应该如何解决?
建站之星CMS五站合一模板配置与SEO优化指南
如何快速搭建高效简练网站?
山东网站制作公司有哪些,山东大源集团官网?
如何在香港服务器上快速搭建免备案网站?
如何在建站之星绑定自定义域名?
武清网站制作公司,天津武清个人营业执照注销查询系统网站?
香港服务器WordPress建站指南:SEO优化与高效部署策略
网站企业制作流程,用什么语言做企业网站比较好?
,购物网站怎么盈利呢?
胶州企业网站制作公司,青岛石头网络科技有限公司怎么样?
临沂网站制作企业,临沂第三中学官方网站?
企业网站制作公司网页,推荐几家专业的天津网站制作公司?
如何在云主机上快速搭建多站点网站?
网站制作的步骤包括,正确网址格式怎么写?
娃派WAP自助建站:免费模板+移动优化,快速打造专业网站
如何快速启动建站代理加盟业务?
北京网站制作费用多少,建立一个公司网站的费用.有哪些部分,分别要多少钱?
如何通过建站之星自助学习解决操作问题?
javascript中的try catch异常捕获机制用法分析
定制建站平台哪家好?企业官网搭建与快速建站方案推荐
如何基于云服务器快速搭建网站及云盘系统?
头像制作网站在线制作软件,dw网页背景图像怎么设置?
c# await 一个已经完成的Task会发生什么
建站之星如何实现五合一智能建站与营销推广?
音响网站制作视频教程,隆霸音响官方网站?
关于BootStrap modal 在IOS9中不能弹出的解决方法(IOS 9 bootstrap modal ios 9 noticework)
威客平台建站流程解析:高效搭建教程与设计优化方案
C++如何编写函数模板?(泛型编程入门)
如何解决ASP生成WAP建站中文乱码问题?
教学论文网站制作软件有哪些,写论文用什么软件
?
建站之星免费模板:自助建站系统与智能响应式一键生成
高防服务器租用指南:配置选择与快速部署攻略
宁波自助建站系统如何快速打造专业企业网站?
深圳网站制作费用多少钱,读秀,深圳文献港这样的网站很多只提供网上试读,但有些人只要提供试读的文章就能全篇下载,这个是怎么弄的?
如何将凡科建站内容保存为本地文件?
微网站制作教程,不会写代码,不会编程,怎么样建自己的网站?
seo网站制作优化,网站SEO优化步骤有哪些?
c++怎么用jemalloc c++替换默认内存分配器【性能】
网站制作大概多少钱一个,做一个平台网站大概多少钱?
高防服务器如何保障网站安全无虞?
如何在阿里云ECS服务器部署织梦CMS网站?
如何选择服务器才能高效搭建专属网站?
ppt在线制作免费网站推荐,有什么下载免费的ppt模板网站?
网站制作软件有哪些,制图软件有哪些?
建站之星好吗?新手能否轻松上手建站?
如何选择高效稳定的ISP建站解决方案?
昆明高端网站制作公司,昆明公租房申请网上登录入口?
*请认真填写需求信息,我们会在24小时内与您取得联系。