登录
首页 >  Golang >  Go问答

无端口转发的调度程序-工作人员集群

来源:stackoverflow

时间:2024-04-19 08:36:35 136浏览 收藏

从现在开始,我们要努力学习啦!今天我给大家带来《无端口转发的调度程序-工作人员集群》,感兴趣的朋友请继续看下去吧!下文中的内容我们主要会涉及到等等知识点,如果在阅读本文过程中有遇到不清楚的地方,欢迎留言呀!我们一起讨论,一起学习!

问题内容

你好 Satckoverflow!

TLDR 我想重新创建 https://github.com/KorayGocmen/scheduler-worker-grpc 而无需在工作线程上进行端口转发。

我正在尝试构建一个竞争性编程评审服务器,用于评估提交的内容,作为我向孩子们教授编程的学校的一个项目。

由于评估计算量很大,我希望有多个工作节点。 调度程序将接收提交并将其分发给工作节点。为了便于工作人员部署(因为它经常发生变化),我希望工作人员能够订阅调度程序,从而成为工作人员并接收作业。

工作线程可能与调度程序不在同一网络上+工作线程驻留在虚拟机中(也许稍后会移植到 docker,但目前存在问题)。

调度程序应该能够了解工作线程的资源使用情况,向工作线程发送不同类型的作业并接收结果流。

我目前正在考虑使用 grpc 来解决我的工作人员和调度程序之间的通信需求。

我可以创建多个调度程序服务方法,例如:

  1. 注册工人,接收一系列工作
  2. 流式传输作业结果,但什么也不接收
  3. 定期流式传输工作线程状态,不接收任何内容

但是我更喜欢以下内容,但不知道是否可能:

  • 调度程序 GRPC API:
    • 注册一个worker(使worker GRPC api可供调度程序使用)
  • worker GRPC API:
    • 开始一项工作(返回工作状态流)
    • 取消工作???
    • 获取资源使用情况

如果连接丢失,工作人员应自动取消注册。

所以我的问题是...如果工作人员位于 NAT 后面且没有端口转发,是否可以创建一个 grpc 工作人员 api,可以将其注册到调度程序以供以后使用?

其他可能不必要的信息:

更糟糕的是,我有多种完全不同类型的工作(流式传输交互式控制台、针对准备好的测试用例执行代码)。我可能只是为不同的工作创建不同的工人。

有时,作业涉及在本地文件系统上有大文件(最多 500 MB),这些文件通常保存在调度程序附近,因此我想将作业发送给已经从调度程序下载了特定文件的工作人员。否则,请在其中一名工作人员上下载大文件。在工作进程上同时保存所有文件将需要超过 20 GB,因此我想避免它。

一个worker可以同时运行多个作业(最多16个)。

我正在用 go 编写系统。


正确答案


只要只有工作人员发起连接,您就不必担心 nat。 grpc 支持任一方向(或两个方向)的流式传输。这意味着您的所有需求都可以仅使用调度程序上的一台服务器来实现;调度程序不需要连接回工作人员。

根据您的描述,您的服务可能如下所示:

syntax = "proto3";

import "google/protobuf/empty.proto";

service scheduler {
    rpc getjobs(getjobsrequest) returns (stream getjobsresponse) {}
    rpc reportworkerstatus(stream reportworkerstatusrequest) returns (google.protobuf.empty) {}
    rpc reportjobstatus(stream jobstatus) returns (stream jobaction) {}
}

enum jobtype {
    job_type_unspecified = 0;
    job_type_console = 1;
    job_type_exec = 2;
}

message getjobsrequest {
    // list of job types this worker is willing to accept.
    repeated jobtype types = 1;
}

message getjobsresponse {
    string jobid = 0;
    jobtype type = 1;

    string filename = 2;
    bytes filecontent = 3;
    // etc.
}

message reportworkerstatusrequest {
    float cpuload = 0;
    uint64 availablediskspace = 1;
    uint64 availablememory = 2;
    // etc.

    // list of filenames or file hashes, or whatever else you need to precisely
    // report the presence of files.
    repeated string havefiles = 2;
}

这在很大程度上是一个偏好问题(例如,您可以使用 oneof 而不是枚举),但希望很明显,从客户端到服务器的单个连接足以满足您的要求。

维护可用工作人员集非常简单:

func (s *Server) GetJobs(req *pb.GetJobRequest, stream pb.Scheduler_GetJobsServer) error {
    ctx := stream.Context()

    s.scheduler.AddWorker(req)
    defer s.scheduler.RemoveWorker(req)

    for {
        job, err := s.scheduler.GetJob(ctx, req)
        switch {
        case ctx.Err() != nil: // client disconnected
            return nil
        case err != nil:
            return err
        }

        if err := stream.Send(job); err != nil {
            return err
        }
    }
}

The Basics tutorial includes examples for all types of streaming,包括 go 中的服务器和客户端实现。

至于注册,这通常只意味着创建工作人员在与服务器通信时使用的某种凭证。这可能是随机生成的令牌(服务器可以使用它来加载关联的元数据)、用户名/密码组合、tls 客户端证书等。详细信息将取决于您的基础设施和设置工作人员时所需的工作流程。

今天带大家了解了的相关知识,希望对你有所帮助;关于Golang的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

声明:本文转载于:stackoverflow 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>