推荐文章 Go 技术课程下载专题 AI

首页 > Golang > Go问答

使用 go-colly 框架进行网站内容爬取

来源：stackoverflow

时间：2024-02-16 14:21:16 285浏览收藏

大家好，今天本人给大家带来文章《使用 go-colly 框架进行网站内容爬取》，文中内容主要涉及到，如果你对Golang方面的知识点感兴趣，那就请各位朋友继续看下去吧~希望能真正帮到你们，谢谢！

问题内容

我尝试从网站上抓取描述 img，但我不知道如何到达那里

我的尝试

pg := Program{}
slPG := []Program{}

c.OnHTML(".short", func(e *colly.HTMLElement) {
    pg.Name = e.ChildText("h2.short-cat")
    pg.Link = e.ChildAttr("a", "href")
    pg.Rating = e.ChildText("a.orating_res")
    pg.Discription = e.ChildText("div.short-text full-text video-box clearfix")

    slPG = append(slPG, pg)
})
for i := 1; i < 6; i++ {
    c.Visit("https://rsload.net/page/" + strconv.Itoa(i) + "/")
}

file, err := json.MarshalIndent(slPG, "", " ")
if err != nil {
    log.Println("Unable to create 'json' file")
    return
}
_ = ioutil.WriteFile("files/Export.json", file, 0644)

正确答案

请显示您的更多代码。具体来说，您需要显示您想要抓取的 html 部分。我知道你有一部分文本和属性，但是 colly 库非常挑剔。如果您没有完全正确的信息。它不会给你任何回报。您是通过命令行中的 fmt 获取信息，还是将其解析为 gui，或者可能将其全部转换为文件？提供更多信息，我们可以提供帮助。

以上就是本文的全部内容了，是否有顺利帮助你解决问题？若是能给你带来学习上的帮助，请大家多多支持golang学习网！更多关于Golang的相关知识，也可关注golang学习网公众号。

声明：本文转载于：stackoverflow 如有侵犯，请联系study_golang@163.com删除

相关阅读

更多>

Golang · Go问答 | 3年前 | go · goland · selenium · golang

GoLand调式动态执行代码

502 收藏
Golang · Go问答 | 3年前 | go · nginx · golang

用Nginx反向代理部署go写的网站。

502 收藏
Golang · Go问答 | 3年前 | go · 运行时间 · golang

Golang取得代码运行时间的问题

501 收藏
Golang · Go问答 | 3年前 | go · golang

请问 go 代码如何实现在代码改动后不需要Ctrl+c，然后重新 go run *.go 文件？

501 收藏
Golang · Go问答 | 3年前 | golang · golang

如何从同一个 io.Reader 读取多次

501 收藏

最新阅读

更多>

Golang · Go问答 | 17小时前 | JSON · Slice · Go问答 · 接口响应 · JSON json.Marshal Go问答 nil slice 空slice

Go 问答：nil slice 和空 slice 有什么区别，JSON 为什么一个是 null 一个是 []

157 收藏
Golang · Go问答 | 1天前 | sync.Once · 初始化 · 并发控制 · 原子操作 · Go问答 · 初始化 Go 原子操作并发 sync.Once 只执行一次

Go 问答：sync.Once 为什么能保证只执行一次，多协程下怎么复用

142 收藏
Golang · Go问答 | 2天前 | golang · range · Go问答 · 循环变量 · Go1.22 · 指针 range Go 闭包循环变量 Go 1.22

Go 问答：range 循环变量取地址为什么容易踩坑，Go 1.22 后还要复制吗

319 收藏
Golang · Go问答 | 3天前 | append · golang · Slice · Go问答 · Go Slice CAP 底层数组 append Go问答 len

Go 问答：append 后原 slice 为什么有时会变，有时不会

236 收藏
Golang · Go问答 | 3天前 | nil · interface · golang · Go问答 · Go error nil interface typed nil Go问答

Go 问答：为什么接口变量明明装的是 nil，判断却不等于 nil

238 收藏
Golang · Go问答 | 4天前 | defer · golang · 资源管理 · Go问答 · Go 错误处理 defer 循环文件句柄资源释放

Go 问答：defer 为什么不适合直接放在大循环里，资源该怎么释放

418 收藏
Golang · Go问答 | 4天前 | map · golang · 并发编程 · Go问答 · Go 并发安全 RWMutex sync.Map map并发读写

Go 问答：为什么并发读写 map 会 panic，sync.Map 和锁该怎么选

109 收藏
Golang · Go问答 | 3个月前 | go atomic原理 Go并发安全

Go语言中atomic包如何保证并发安全？

109 收藏
Golang · Go问答 | 3个月前 | Go性能优化 go map扩容 Go哈希表原理

Go语言中map扩容机制是如何实现的？

177 收藏
Golang · Go问答 | 3个月前 | go select机制 Go并发原理

Go语言中select为什么是随机选择？

103 收藏
Golang · Go问答 | 3个月前 | Go并发map Go sync.Map

Go语言中sync.Map适合什么场景？

331 收藏
Golang · Go问答 | 3个月前 | Go性能优化 Go sync.Pool Go对象池

Go语言中sync.Pool的作用是什么？

496 收藏

课程推荐

更多>

前端进阶之JavaScript设计模式

设计模式是开发人员在软件开发过程中面临一般问题时的解决方案，代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景，打造一站式知识长龙服务，适合有JS基础的同学学习。

立即学习 543次学习
GO语言核心编程课程

本课程采用真实案例，全面具体可落地，从理论到实践，一步一步将GO核心编程技术、编程思想、底层实现融会贯通，使学习者贴近时代脉搏，做IT互联网时代的弄潮儿。

立即学习 516次学习
简单聊聊mysql8与网络通信

如有问题加微信：Le-studyg；在课程中，我们将首先介绍MySQL8的新特性，包括性能优化、安全增强、新数据类型等，帮助学生快速熟悉MySQL8的最新功能。接着，我们将深入解析MySQL的网络通信机制，包括协议、连接管理、数据传输等，让

立即学习 500次学习
JavaScript正则表达式基础与实战

在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。

立即学习 487次学习
从零制作响应式网站—Grid布局

本系列教程将展示从零制作一个假想的网络科技公司官网，分为导航，轮播，关于我们，成功案例，服务流程，团队介绍，数据部分，公司动态，底部信息等内容区块。网站整体采用CSSGrid布局，支持响应式，有流畅过渡和展现动画。

立即学习 485次学习