重复使用 Go 中的 HTTP 请求对象
来源:stackoverflow
时间:2024-03-26 13:09:33 471浏览 收藏
在 Go 中重复使用 HTTP 请求对象时,您可能会遇到令牌无效的错误,这是因为 Go 默认情况下为每个请求使用一个新实例。为了获得与 Python 中相同的行为,可以使用 `colly.Clone()` 方法克隆收集器,从而重复使用 HTTP 请求对象。`colly.Clone()` 方法返回一个新的收集器,该收集器与原始收集器共享相同的配置和会话,允许您在不同的请求之间重用令牌等会话数据。
问题内容
我正在构建一个 api,可以从网页上抓取一些数据。
为此,我需要向主页发送 get 请求,从 html 中抓取“requestverificationtoken”,然后使用用户名、密码和 requestverificationtoken 向同一 url 发送另一个 post 请求。
我之前已经能够使用 python 做到这一点:
session_requests = requests.session() result = session_requests.get(LOGIN_URL) parser = createBS4Parser(result.text) return parser.find('input', attrs={'name': '__RequestVerificationToken'})["value"] pageDOM = session_requests.post( LOGIN_URL, data=requestPayload, //RequestVerificationToken is in here headers=requestHeaders )
当我在 python 中重用 session_requests
变量时,它似乎重用了 http 请求的前一个实例。
但是,当我尝试在 go 中执行此操作时,由于令牌无效而收到错误。我认为这是因为对于 post 请求,go 使用了一个新实例。
有什么方法可以让我从 go 获得与使用 python 相同的行为吗?
正确答案
package main import ( "fmt" "log" "github.com/gocolly/colly" "github.com/gocolly/colly/proxy" ) func main() { //initiates the configuration c := colly.NewCollector(colly.AllowURLRevisit()) //defining the proxy chain revpro, err := proxy.RoundRobinProxySwitcher("socks5://127.0.0.1:9050", "socks5://127.0.0.1:9050") if err != nil { log.Fatal(err) } c.SetProxyFunc(revpro) //parsing the required field from html we are extracting the csrf_token required for the login c.OnHTML("form[role=form] input[type=hidden][name=CSRF_TOKEN]", func(e *colly.HTMLElement) { csrftok := e.Attr("value") fmt.Println(csrftok) //posting the csrf value along with password err := c.Post("https://www.something.com/login.jsp", map[string]string{"CSRF_TOKEN": csrftok, "username": "username", "password": "password"}) if err != nil { log.Fatal(err) } return }) //The website to visit c.Visit("https://www.something.com/login.jsp") //maintaining the connection using clone not initiating a callback request d := c.Clone() d.OnHTML("a[href]", func(e *colly.HTMLElement) { link := e.Attr("href") fmt.Printf("Link found: %q -> %s\n", e.Text, link) }) d.Visit("https://skkskskskk.htm") }
以上就是《重复使用 Go 中的 HTTP 请求对象》的详细内容,更多关于的资料请关注golang学习网公众号!
声明:本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
-
502 收藏
-
502 收藏
-
501 收藏
-
501 收藏
-
501 收藏
最新阅读
更多>
-
139 收藏
-
204 收藏
-
325 收藏
-
477 收藏
-
486 收藏
-
439 收藏
课程推荐
更多>
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 507次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习