登录
首页 >  文章 >  python教程

如何使用 XPath 表达式过滤子标签并提取文本内容?

时间:2024-11-24 17:09:47 292浏览 收藏

文章小白一枚,正在不断学习积累知识,现将学习到的知识记录一下,也是将我的所得分享给大家!而今天这篇文章《如何使用 XPath 表达式过滤子标签并提取文本内容?》带大家来了解一下##content_title##,希望对大家的知识积累有所帮助,从而弥补自己的不足,助力实战开发!


如何使用 XPath 表达式过滤子标签并提取文本内容?

过滤子标签中的特定标签获取文本内容

问题描述:

如何使用 xpath 表达式从包含多个子标签的标签中提取文本内容,同时排除特定子标签?

尝试过的解决方法:

已尝试使用以下 xpath 表达式,但均无法解决问题:

  • xpath('//p/*[@name != "a"]')
  • xpath('//p/<em>[@name != "a"]')
  • xpath('//p/*[@name != "a"]')

样本内容:

<div>
  <p>
    <a>123</a>
    这是要获取的文本
  </p>
</div>

目标:

需要获取 div 中 p 标签的文本内容,但需要过滤掉 a 标签。

解决方法:

问题已解决,正确的 xpath 表达式为:

li.xpath('p')[0].xpath('string(.)')

今天关于《如何使用 XPath 表达式过滤子标签并提取文本内容?》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

相关阅读
更多>
最新阅读
更多>
课程推荐
更多>