登录
首页 >  文章 >  python教程

如何使用 Scrapy Xpath 获取 div 标签下的完整 HTML 内容?

时间:2024-11-03 11:34:01 164浏览 收藏

你在学习文章相关的知识吗?本文《如何使用 Scrapy Xpath 获取 div 标签下的完整 HTML 内容? 》,主要介绍的内容就涉及到,如果你想提升自己的开发能力,就不要错过这篇文章,大家要知道编程理论基础和实战操作都是不可或缺的哦!

如何使用 Scrapy Xpath 获取 div 标签下的完整 HTML 内容?

如何用 scrapy xpath 获取指定标签下的完整 html 内容?

给定以下 html 片段:

<div class="contson">
    这是文本
    <p>aaaa</p>
     这是文本2
     <br>
      这是文本3
</div>

我们希望获取 div.contson 中的所有内容,包括 html 标签。

'这是文本<p>aaaa</p>这是文本2<br>这是文本3'

通常方法,如 string(.),只能获取纯文本。然而,node() 函数可以获取指定元素下的所有节点、元素和内容。

使用以下 xpath 表达式:

xx.xpath('//div[@class="contson"]/node()').extract()

然后将列表转换为字符串:

"".join(xx)

即可得到所需的完整 html 内容。

今天关于《如何使用 Scrapy Xpath 获取 div 标签下的完整 HTML 内容? 》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

相关阅读
更多>
最新阅读
更多>
课程推荐
更多>