登录
首页 >  Golang >  Go问答

提取私人站点信息需认证(使用Golang)

来源:stackoverflow

时间:2024-03-21 11:33:32 385浏览 收藏

提取私人站点信息时,使用 Go 语言可能会遇到认证问题。本文介绍了一个代码示例,该示例旨在从在线时间表中提取课程信息,但无法通过登录阶段。文章建议检查登录调用的状态代码、检查 cookie jar 以确保已保存 cookie,以及使用带有 -v 的 curl 执行相同的顺序以深入了解通话计划。

问题内容

我试图从我的在线时间表中提取我的课程,但是,似乎我无法通过登录阶段。我的代码是:

package main

import (
    "fmt"
    "io/ioutil"
    "log"
    "net/http"
    "net/url"
    "strings"

    "github.com/puerkitobio/goquery"
)

type app struct {
    client *http.client
}

type timetable struct {
    name string
}

const (
    baseurl string = "https://myclasswebsite.com"
)

func (app *app) login() {
    //login := logininfo()
    client := app.client
    loginurl := baseurl + "/portal2/#!/login"

    data := url.values{
        "inputemail": {"my_actual_username"},
        "password":   {"my_actual_password"},
    }

    response, err := client.postform(loginurl, data)

    if err != nil {
        log.fatalln(err)
    }

    defer response.body.close()

    _, err = ioutil.readall(response.body)
    if err != nil {
        log.fatalln(err)
    }
}

func (app *app) gettimetable() []timetable {
    timetableurl := baseurl + "/portal/dashboard"
    client := app.client

    response, err := client.get(timetableurl)
    if err != nil {
        log.fatalln("error fetching response. ", err)
    }

    defer response.body.close()

    document, err := goquery.newdocumentfromreader(response.body)

    fmt.println(document.html())

    if err != nil {
        log.fatal("error loading http response body. ", err)
    }

    var classes []timetable

    document.find(".timetable table").each(func(i int, s *goquery.selection) {
        classname := strings.trimspace(s.text())
        class := timetable{
            name: classname,
        }

        classes = append(classes, class)
    })

    return classes
}

出于隐私原因,我更改了基本 url 和登录信息,但是,其余代码保持原样。

我的主要。 go 文件是:

package main

import (
    "fmt"
    "net/http"
    "net/http/cookiejar"
)

func main() {
    jar, _ := cookiejar.New(nil)

    app := App{
        Client: &http.Client{Jar: jar},
    }

    app.login()
    classes := app.getTimetable()
    fmt.Println("class array is", classes)
    for index, class := range classes {
        fmt.Printf("%d: %s\n", index+1, class.Name)
    }
}

最终打印返回一个空切片,当我将response.html()打印到控制台时,我收到登录页面html而不是仪表板页面html。

我绝不指望有人为我解决这个问题,但第二双眼睛以及我应该朝哪个方向走的线索也许会有所帮助。非常感谢!


正确答案


由于我不熟悉你们的课程网站,所以一些进步的想法:

您没有检查登录调用中的状态代码。您可能会收到非 200 状态代码。

确认状态代码后,检查 cookie jar 以确保 cookie 已保存。这可能不太可能,但值得检查。

最后,尝试使用带有 -v 的curl 执行相同的顺序(如果您还没有这样做)。这将使您更深入地了解通话计划的情况。

文中关于的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《提取私人站点信息需认证(使用Golang)》文章吧,也可关注golang学习网公众号了解相关技术文章。

声明:本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>