登录
首页 >  Golang >  Go问答

打断系统调用

来源:stackoverflow

时间:2024-03-21 22:12:30 363浏览 收藏

在从 NFS/GPFS 卷执行大量读取时,Go 服务会遇到系统调用挂起的问题,导致服务崩溃。缺乏对底层系统线程的控制使得在 Go 中实现超时机制来防止崩溃变得困难。本文提供了一种解决方案,使用 syscall 包获取进程 PID,并在超时(5 秒)后通过 FindProcess 和 Kill 方法终止进程,从而避免服务崩溃。

问题内容

我有一个 go 服务从 nfs / gpfs 卷进行大量读取。我偶尔会遇到大规模问题,其中底层挂载无法响应特定的系统调用,导致整个服务被内核关闭:

[98549.941930]       Tainted: G           O    4.14.13-1.el7.elrepo.x86_64 #1
[98549.942454] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
[98549.943422] ls              D    0 14884      1 0x00000084
[98549.943968] Call Trace:
[98549.944498]  __schedule+0x28d/0x880
[98549.945033]  schedule+0x36/0x80
[98549.945552]  schedule_preempt_disabled+0xe/0x10
[98549.946095]  __mutex_lock.isra.5+0x269/0x500
[98549.946611]  __mutex_lock_slowpath+0x13/0x20
[98549.947153]  mutex_lock+0x2f/0x40
[98549.947695]  fuse_lock_inode+0x2a/0x30 [fuse]
[98549.948248]  fuse_readdir+0x113/0x7e0 [fuse]
[98549.948795]  iterate_dir+0x16e/0x190
[98549.949323]  ? __audit_syscall_entry+0xaf/0x100
[98549.949847]  SyS_getdents+0x98/0x120
[98549.950358]  ? iterate_dir+0x190/0x190
[98549.950898]  do_syscall_64+0x67/0x1b0
[98549.951410]  entry_SYSCALL64_slow_path+0x25/0x25
[98549.951948] RIP: 0033:0x7ffff749dcb5
[98549.952454] RSP: 002b:00007fffffffd160 EFLAGS: 00000246 ORIG_RAX: 000000000000004e
[98549.953423] RAX: ffffffffffffffda RBX: 00000000006260a0 RCX: 00007ffff749dcb5
[98549.953985] RDX: 0000000000008000 RSI: 00000000006260a0 RDI: 0000000000000005
[98549.954518] RBP: 00000000006260a0 R08: 0000000000000080 R09: 0000000000008030
[98549.955131] R10: 00007fffffffced0 R11: 0000000000000246 R12: fffffffffffffe90
[98549.955655] R13: 0000000000000000 R14: 0000000000626030 R15: 0000000000626000

我正在寻找一种添加超时的方法,以便任何失败的系统调用都不会导致整个服务崩溃,但在 go 中找不到一个好的方法。

我发现的一种常见设计是从操作系统线程运行系统调用并在超时时终止该线程,但由于缺乏对底层系统线程的控制,这在 golang 中似乎不可能实现。该服务通常并行执行大量系统调用(可能是数百个)。


解决方案


您可以使用sycall包获取进程的pid

pid, _, _ := syscall.syscall(syscall.sys_getpid, 0, 0, 0)

然后通过pid杀死进程

select {
    case end = <-endSignal:
        fmt.Println("The end!")
    case <-time.After(5 * time.Second):
        proc, _ := os.FindProcess(pid)
        // Kill the process
         proc.Kill()
    }

本篇关于《打断系统调用》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于Golang的相关知识,请关注golang学习网公众号!

声明:本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>