登录
首页 >  Golang >  Go问答

如何“将 Go 指针传递给 Cgo”?

来源:stackoverflow

时间:2024-03-17 09:30:31 307浏览 收藏

Go 指针传递给 Cgo 时,Go 会固定指针以防止其被垃圾回收。当 Go 指针转换为 C 类型(如 `uintptr` 或 `*c.char`)时,Go 会检查该值是否指向 Go 分配的内存,如果指向,则会进行固定。然而,如果 C 函数签名中使用 `void*` 参数,则 Go 无法确定该参数是否指向 Go 指针,因此不会进行固定。因此,在传递 Go 指针时,建议使用 `unsafe.pointer` 类型,它允许直接传递 Go 指针而不进行任何类型转换。

问题内容

我对将 go 指针(据我理解,包括所有指针类型以及 unsafe.pointer)传递给 cgo 感到困惑。当使用 cgo 调用 c 函数时,我提供 c 端已知类型的变量,或者 unsafe.pointer(如果它与 c 函数签名中的 void* 类型参数匹配)。因此,当“传递给 c 的 go 指针在调用的生命周期内固定”时,如果我被迫将其强制转换为 c.some_wide_enough_uint_typec.some_c_pointer_type,go 如何知道我传递的实际上是一个 go 指针预先?当它被转换的那一刻,它是一个 go 指针的信息不是丢失了,并且我面临着 gc 改变指针的风险吗? (我至少可以看到当 go 端保留指针类型引用时如何防止释放)

我们有一个项目,其中包含大量可运行的 cgo 代码,但对其可靠性零信心。我希望看到一个“这里是如何正确执行此操作”的示例,它不会通过使用 c.malloc() 等来规避 go 的内存模型,不幸的是,大多数示例都这样做。

因此,无论“在调用的生命周期内固定指针”实际上意味着什么,我都看到了一个问题:

  1. 如果这意味着 go 将固定整个程序中的所有指针,我会在将 go 指针转换为 c 类型与实际执行的 cgo 调用之间的时间间隔中看到竞争条件调用。
  2. 如果这意味着go只会固定那些正在传递的go指针,那么当调用时它们只能是c类型时,它如何知道它们是go指针?

我已经阅读了半天的 go 问题,开始觉得我只是错过了一些简单的东西。任何指针表示赞赏。

编辑:我将尝试通过提供示例来澄清问题。

考虑一下:

/*
#include 
void mycfunc(void* ptr) {
    printf((char*)ptr);
}
*/
import "c"
import "unsafe"

func callmycfunc() {
    gopointer := []byte("abc123\n\x00")
    c.mycfunc(unsafe.pointer(&gopointer[0]))
}

在这里,go 的 unsafe.pointer 类型毫不费力地转换为 c 的 void* 类型,所以我们对 c 端的事情感到高兴,我们也应该在 go 端:指针明确指向 go - 分配的内存,因此 go 应该很容易弄清楚它应该在调用期间固定该指针,尽管它是一个不安全指针。 是这样吗?如果是这样,无需进一步研究,我会认为这是将 go 指针传递给 cgo 的首选方式。 是吗?

然后,考虑一下:

/*
#include 
void mycfunc(unsigned long long int stupidlytypedpointervariable) {
    char* pointertohopefullystillthesamememory = (char*)stupidlytypedpointervariable;
    printf(pointertohopefullystillthesamememory);
}
*/
import "c"
import "unsafe"

func callmycfunc() {
    gopointer := []byte("abc123\n\x00")
    c.mycfunc(c.ulonglong(uintptr(unsafe.pointer(&gopointer[0]))))
}

在这里,我希望 go 不会对某些 c.ulonglong 类型的变量是否实际上意味着包含 go 指针的地址进行任何猜测。 但是我对吗?

我的困惑很大程度上源于这样一个事实:实际上不可能编写一些代码来可靠地测试它。

最后,这个怎么样:

/*
#include 
void cFuncOverWhichIHaveNoControl(char* ptr) {
    printf(ptr);
}
*/
import "C"
import "unsafe"

func callMyCFunc() {
    goPointer := []byte("abc123\n\x00")
    C.cFuncOverWhichIHaveNoControl((*C.char)(unsafe.Pointer(&goPointer[0])))
}

如果我出于某种原因无法更改 c 函数的签名,我必须强制转换为 *c.char当该值已经是 c 指针类型时,go 还会检查该值是否是 go 指针吗?


解决方案


查看 the section on passing pointers in the current cgo documentation,(感谢 peterso)我们发现

go指针一词是指指向go分配的内存的指针

还有

指针类型可以保存 go 指针或 c 指针

因此,使用 uintptr 和其他整数(即:非指针)类型将使我们失去 go 固定指针的保证。

uintptr 是一个整数,而不是一个引用。将指针转换为 uintptr 会创建一个没有指针语义的整数值。即使 uintptr 保存了某个对象的地址,如果该对象移动,垃圾收集器也不会更新该 uintptr 的值,该 uintptr 也不会阻止该对象被回收。

来源:https://golang.org/pkg/unsafe/#Pointer

关于 *char/*c.char 等 c 指针类型,只有当指向的数据本身不包含指向 go 分配的其他内存的指针时,这些才是安全的。这实际上可以是通过尝试触发 go 的 cgo 调试机制来显示,该机制不允许将 go 指针传递给(或传入)本身包含另一个 go 指针的值:

package main

import (
    "fmt"
    "unsafe"

    /*
    #include 

    void cfuncchar(char* ptr) {
        printf("%s\n", ptr);
    }

    void cfuncvoid(void* ptr) {
        printf("%s\n", (char*)ptr);
    }
    */
    "c"
)

type mystruct struct {
    distraction [2]byte
    dangerous *mystruct
}

func main() {
    bypassdetection()
    triggerdetection()
}

func bypassdetection() {
    fmt.println("=== bypass detection ===")
    ms := &mystruct{[2]byte{'a', 0}, &mystruct{[2]byte{0, 0}, nil}}
    c.cfuncchar((*c.char)(unsafe.pointer(ms)))
}

func triggerdetection() {
    fmt.println("=== trigger detection ===")
    ms := &mystruct{[2]byte{'b', 0}, &mystruct{[2]byte{0, 0}, nil}}
    c.cfuncvoid(unsafe.pointer(ms))
}

这将打印以下内容:

=== Bypass Detection ===
A
=== Trigger Detection ===
panic: runtime error: cgo argument has Go pointer to Go pointer

使用*c.char绕过了检测。 仅使用 unsafe.pointer 才能检测 go 指针到 go 指针的情况。不幸的是,这意味着我们必须在 c 函数的签名中偶尔出现模糊的 void* 参数。

为了清楚起见,添加:go 很可能会固定 *c.char 等指向的值,这是可以安全传递的;它只是(合理地)不会努力找出它是否可能包含其他指向 go 分配的内存的指针。转换为 unsafe.pointer 实际上是安全的;铸造来自这可能是危险的。

理论要掌握,实操不能落!以上关于《如何“将 Go 指针传递给 Cgo”?》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!

声明:本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>