登录
首页 >  文章 >  python教程

如何使用 XPath 技巧过滤子标签获取标签文本?

时间:2024-12-16 08:15:59 396浏览 收藏

本篇文章主要是结合我之前面试的各种经历和实战开发中遇到的问题解决经验整理的,希望这篇《如何使用 XPath 技巧过滤子标签获取标签文本?》对你有很大帮助!欢迎收藏,分享给更多的需要的朋友学习~

如何使用 XPath 技巧过滤子标签获取标签文本?

过滤子标签获取标签文本:xpath 技巧

在使用 xpath 时,如果目标标签包含嵌套子标签,而您只想获取特定子标签的文本,忽略其他子标签,这是一个常见的问题。

问题展示

例如,如果您需要获取以下 html 内容中 <p> 标签的文本,但要过滤掉 <a> 标签:

<div>
<p>
<a>123</a>
这是要获取的文本
</p>
</div>

使用以下 xpath 表达式似乎无法达到目的:

  • //p/*[@name != "a"]
  • //p/[@name != "a"]

解决方案

为了解决此问题,可以使用以下xpath 表达式:

li.xpath('p')[0].xpath('string(.)')

具体步骤如下:

  1. 使用 .xpath('p') 从 li 上下文中定位所有 <p> 标签。
  2. 使用 [0] 索引来获取第一个 <p> 标签。
  3. 使用 .xpath('string(.)') 从 <p> 标签中提取文本内容。

这样,您可以过滤掉嵌套的子标签,只获取目标标签的文本。

今天关于《如何使用 XPath 技巧过滤子标签获取标签文本?》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于的内容请关注golang学习网公众号!

相关阅读
更多>
最新阅读
更多>
课程推荐
更多>