推荐文章 Go 技术课程下载专题 AI

首页 > Golang > Go问答

获取网站的著作权归属信息

来源：stackoverflow

时间：2024-02-18 19:03:22 302浏览收藏

最近发现不少小伙伴都对Golang很感兴趣，所以今天继续给大家介绍Golang相关的知识，本文《获取网站的著作权归属信息》主要内容涉及到等等知识点，希望能帮到你！当然如果阅读本文时存在不同想法，可以在评论中表达，但是请勿使用过激的措辞~

问题内容

我正在尝试在 golang 中构建一个程序，通过检查网站的版权标签来检查域列表是否属于某个组织。例如，如果您访问 sony.com，那么您将看到 copyright 2021 sony group corporation 位于页面底部，类似地，如果您访问 tesla.com，您将看到 tesla © 2021。我也在使用 whois 进行验证，这是另一个。

我已经尝试了大多数正则表达式，包括此处的正则表达式来匹配版权声明，但它们似乎不起作用。

这是我现在找到的完整代码正则表达式。

package main

import (
    "fmt"
    "io/ioutil"
    "net/http"
    "regexp"
)

func main() {
    domain := "sony.com"
    url := "http://" + domain

    resp, err := http.Get(url)

    if err != nil {
        panic(err)
    }
    defer resp.Body.Close()

    // reads html as a slice of bytes
    html, err := ioutil.ReadAll(resp.Body)
    if err != nil {
        panic(err)
    }

    // it will find the substring from html data
    r, _ := regexp.Compile("20[1-3][1-3]")
    if r.FindString(string(html)) != "" {
        fmt.Println(r.FindString(string(html)))
    }

}

这只会输出 2021。我正在尝试实现一个完整的声明，通过它我至少可以获得公司名称。

正确答案

这对于任何网站来说都不可靠，但您可以尝试一下，并可以选择添加一些其他版权起始字符串的情况：

package main

import (
    "fmt"
    "io/ioutil"
    "net/http"
    "regexp"
)

func main() {
    domain := "sony.com"
    url := "http://" + domain

    resp, err := http.Get(url)

    if err != nil {
        panic(err)
    }
    defer resp.Body.Close()

    // reads html as a slice of bytes
    html, err := ioutil.ReadAll(resp.Body)
    if err != nil {
        panic(err)
    }

    re, err := regexp.Compile(`>.*(©|Copyright).*20\d\d.*今天关于《获取网站的著作权归属信息》的内容介绍就到此结束，如果有什么疑问或者建议，可以在golang学习网公众号下多多回复交流；文中若有不正之处，也希望回复留言以告知！

声明：本文转载于：stackoverflow 如有侵犯，请联系study_golang@163.com删除

相关阅读

更多>

Golang · Go问答 | 3年前 | go · nginx · golang

用Nginx反向代理部署go写的网站。

502 收藏
Golang · Go问答 | 3年前 | go · goland · selenium · golang

GoLand调式动态执行代码

502 收藏
Golang · Go问答 | 2年前 |

从不同的 go 例程将数据写入同一通道无需等待组即可正常工作

501 收藏
Golang · Go问答 | 2年前 |

Golang rsa-oaep解密失败，前端使用webcrypto

501 收藏
Golang · Go问答 | 2年前 |

如何从用户输入以惰性方式初始化包的全局变量？

501 收藏

最新阅读

更多>

Golang · Go问答 | 1天前 | 并发 · channel · select · 性能排查 · Go问答 · select Go channel context default CPU飙高忙等循环 ticker

Go select 里的 default 为什么会让 CPU 飙高：忙等循环怎么改

438 收藏
Golang · Go问答 | 1天前 | pprof · trace · 性能排查 · Go问答 · 服务安全 · Go pprof 生产环境 trace 安全入口 net/http/pprof 性能排障

Go 服务的 pprof 能直接暴露公网吗？排障入口上线前的安全判断

349 收藏
Golang · Go问答 | 1天前 | channel · 并发编程 · Go问答 · 背压 · 容量规划 · Goroutine channel 缓冲区背压 Go问答 buffered channel 并发容量

Go channel 缓冲区是不是越大越好？容量要按吞吐和延迟定

377 收藏
Golang · Go问答 | 1天前 | interface · 单元测试 · 架构设计 · repository · Go问答 · 单元测试架构设计 interface 接口设计 Go问答调用方定义 Repository

Go interface 应该放在哪一层？为什么更推荐调用方定义小接口

212 收藏
Golang · Go问答 | 1天前 | JSON · time.Time · 接口设计 · Go问答 · encoding/json · encoding/json API响应 JSON序列化 time.Time omitempty Go问答 omitzero

Go JSON 里的 omitempty 为什么漏不掉 time.Time？omitzero 和指针怎么选

315 收藏
Golang · Go问答 | 1天前 | HTTP · Cookie · 浏览器 · cors · Go问答 · SameSite · cookie cors Secure SameSite Go问答 Set-Cookie 跨站请求 credentials

Go 设置 Cookie 后浏览器为什么不带？SameSite、Secure 和跨站请求排查

246 收藏
Golang · Go问答 | 1天前 | 中间件 · Context · Go问答 · 架构模式 · 代码边界 · 中间件 context Context.Value Go问答 WithValue 请求作用域业务参数

Go context 里能放用户信息吗？请求作用域值和业务参数怎么分界

269 收藏
Golang · Go问答 | 1天前 | JSON · 后端开发 · Go问答 · encoding/json · 接口解析 · JSON解析 encoding/json DisallowUnknownFields Go问答 RawMessage json.Decoder UseNumber

Go 解析 JSON 怎么选：struct、map、RawMessage 还是 Decoder

151 收藏
Golang · Go问答 | 2天前 | HTTP · net/http · Go问答 · 流式响应 · ResponseController · net/http FLUSH 流式响应 Go问答 ResponseController FullDuplex 写超时

Go http.ResponseController 有什么用？Flush、写超时和 FullDuplex 这样理解

161 收藏
Golang · Go问答 | 2天前 | HTTP · sse · Go问答 · 用户体验 · 流式响应 · Go EventSource SSE Go问答 Server-Sent Events 长任务进度 http.Flusher

Go 长任务接口怎么返回进度？SSE 流式推送的最小写法

293 收藏
Golang · Go问答 | 2天前 | Timer · 性能优化 · time.After · Go问答 · Go 内存优化 Timer time.After Go问答 time.NewTimer Go1.23

Go time.After 放在循环里还会泄漏吗？从 Go 1.23 变化到工程写法

384 收藏
Golang · Go问答 | 2天前 | go · Context · 并发编程 · 接口超时 · 超时控制 goroutine泄漏 WithTimeout Go context Go问答 CancelFunc

Go context 超时取消为什么重要：从接口耗时到 goroutine 泄漏的治理思路

477 收藏

课程推荐

更多>

前端进阶之JavaScript设计模式

设计模式是开发人员在软件开发过程中面临一般问题时的解决方案，代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景，打造一站式知识长龙服务，适合有JS基础的同学学习。

立即学习 543次学习
GO语言核心编程课程

本课程采用真实案例，全面具体可落地，从理论到实践，一步一步将GO核心编程技术、编程思想、底层实现融会贯通，使学习者贴近时代脉搏，做IT互联网时代的弄潮儿。

立即学习 516次学习
简单聊聊mysql8与网络通信

如有问题加微信：Le-studyg；在课程中，我们将首先介绍MySQL8的新特性，包括性能优化、安全增强、新数据类型等，帮助学生快速熟悉MySQL8的最新功能。接着，我们将深入解析MySQL的网络通信机制，包括协议、连接管理、数据传输等，让

立即学习 500次学习
JavaScript正则表达式基础与实战

在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。

立即学习 487次学习
从零制作响应式网站—Grid布局

本系列教程将展示从零制作一个假想的网络科技公司官网，分为导航，轮播，关于我们，成功案例，服务流程，团队介绍，数据部分，公司动态，底部信息等内容区块。网站整体采用CSSGrid布局，支持响应式，有流畅过渡和展现动画。

立即学习 485次学习