推荐文章 Go 技术课程下载专题 AI

首页 > Golang > Go问答

在 Spark 上执行 Golang Apache Beam 流水线

来源：stackoverflow

时间：2024-02-18 21:39:24 138浏览收藏

“纵有疾风来，人生不言弃”，这句话送给正在学习Golang的朋友们，也希望在阅读本文《在 Spark 上执行 Golang Apache Beam 流水线》后，能够真的帮助到大家。我也会在后续的文章中，陆续更新Golang相关的技术文章，有好的建议欢迎大家在评论留言，非常感谢！

问题内容

我创建了一个简单的 golang Apache Beam 管道，它与 DirectRunner 配合良好。我尝试使用以下命令将其部署在 Spark 集群上： ./bin/spark-submit --master=spark://vm:7077 main.go --runner=SparkRunner --job_endpoint=localhost:8099 --artifact_endpoint=localhost:8098 --environment_type=LOOPBACK --output= /tmp/输出

在提交申请之前，我使用以下命令运行了 job_endpoint ：

./gradlew :runners:spark:job-server:runShadow -PsparkMasterUrl=spark://localhost:7077

该作业在 Spark 上失败，并出现以下错误： 警告 util.NativeCodeLoader：无法为您的平台加载本机 hadoop 库...在适用的情况下使用内置 java 类线程“main”org.apache.spark 中出现异常。 SparkException：无法获取 JAR 中的主类，错误为“null”。请使用 --class. 指定一个

似乎我需要指定类参数，但我不明白该错误是什么意思？我可以获得帮助吗？

解决方案

spark-submit 是一个接受 Java JAR 或 Python 脚本的 Spark 实用程序。它不知道如何运行 Go 程序。

我使用 Spark 运行程序的说明更新了 Beam Go quickstart guide。让我知道这是否适合您。

到这里，我们也就讲完了《在 Spark 上执行 Golang Apache Beam 流水线》的内容了。个人认为，基础知识的学习和巩固，是为了更好的将其运用到项目中，欢迎关注golang学习网公众号，带你了解更多关于的知识点！

声明：本文转载于：stackoverflow 如有侵犯，请联系study_golang@163.com删除

相关阅读

更多>

Golang · Go问答 | 3年前 | go · nginx · golang

用Nginx反向代理部署go写的网站。

502 收藏
Golang · Go问答 | 3年前 | go · goland · selenium · golang

GoLand调式动态执行代码

502 收藏
Golang · Go问答 | 2年前 |

从不同的 go 例程将数据写入同一通道无需等待组即可正常工作

501 收藏
Golang · Go问答 | 2年前 |

Golang rsa-oaep解密失败，前端使用webcrypto

501 收藏
Golang · Go问答 | 2年前 |

如何从用户输入以惰性方式初始化包的全局变量？

501 收藏

最新阅读

更多>

Golang · Go问答 | 2天前 | 并发 · channel · select · 性能排查 · Go问答 · select Go channel context default CPU飙高忙等循环 ticker

Go select 里的 default 为什么会让 CPU 飙高：忙等循环怎么改

438 收藏
Golang · Go问答 | 2天前 | pprof · trace · 性能排查 · Go问答 · 服务安全 · Go pprof 生产环境 trace 安全入口 net/http/pprof 性能排障

Go 服务的 pprof 能直接暴露公网吗？排障入口上线前的安全判断

349 收藏
Golang · Go问答 | 2天前 | channel · 并发编程 · Go问答 · 背压 · 容量规划 · Goroutine channel 缓冲区背压 Go问答 buffered channel 并发容量

Go channel 缓冲区是不是越大越好？容量要按吞吐和延迟定

377 收藏
Golang · Go问答 | 2天前 | interface · 单元测试 · 架构设计 · repository · Go问答 · 单元测试架构设计 interface 接口设计 Go问答调用方定义 Repository

Go interface 应该放在哪一层？为什么更推荐调用方定义小接口

212 收藏
Golang · Go问答 | 2天前 | JSON · time.Time · 接口设计 · Go问答 · encoding/json · encoding/json API响应 JSON序列化 time.Time omitempty Go问答 omitzero

Go JSON 里的 omitempty 为什么漏不掉 time.Time？omitzero 和指针怎么选

315 收藏
Golang · Go问答 | 2天前 | HTTP · Cookie · 浏览器 · cors · Go问答 · SameSite · cookie cors Secure SameSite Go问答 Set-Cookie 跨站请求 credentials

Go 设置 Cookie 后浏览器为什么不带？SameSite、Secure 和跨站请求排查

246 收藏
Golang · Go问答 | 2天前 | 中间件 · Context · Go问答 · 架构模式 · 代码边界 · 中间件 context Context.Value Go问答 WithValue 请求作用域业务参数

Go context 里能放用户信息吗？请求作用域值和业务参数怎么分界

269 收藏
Golang · Go问答 | 2天前 | JSON · 后端开发 · Go问答 · encoding/json · 接口解析 · JSON解析 encoding/json DisallowUnknownFields Go问答 RawMessage json.Decoder UseNumber

Go 解析 JSON 怎么选：struct、map、RawMessage 还是 Decoder

151 收藏
Golang · Go问答 | 3天前 | HTTP · net/http · Go问答 · 流式响应 · ResponseController · net/http FLUSH 流式响应 Go问答 ResponseController FullDuplex 写超时

Go http.ResponseController 有什么用？Flush、写超时和 FullDuplex 这样理解

161 收藏
Golang · Go问答 | 3天前 | HTTP · sse · Go问答 · 用户体验 · 流式响应 · Go EventSource SSE Go问答 Server-Sent Events 长任务进度 http.Flusher

Go 长任务接口怎么返回进度？SSE 流式推送的最小写法

293 收藏
Golang · Go问答 | 3天前 | Timer · 性能优化 · time.After · Go问答 · Go 内存优化 Timer time.After Go问答 time.NewTimer Go1.23

Go time.After 放在循环里还会泄漏吗？从 Go 1.23 变化到工程写法

384 收藏
Golang · Go问答 | 3天前 | go · Context · 并发编程 · 接口超时 · 超时控制 goroutine泄漏 WithTimeout Go context Go问答 CancelFunc

Go context 超时取消为什么重要：从接口耗时到 goroutine 泄漏的治理思路

477 收藏

课程推荐

更多>

前端进阶之JavaScript设计模式

设计模式是开发人员在软件开发过程中面临一般问题时的解决方案，代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景，打造一站式知识长龙服务，适合有JS基础的同学学习。

立即学习 543次学习
GO语言核心编程课程

本课程采用真实案例，全面具体可落地，从理论到实践，一步一步将GO核心编程技术、编程思想、底层实现融会贯通，使学习者贴近时代脉搏，做IT互联网时代的弄潮儿。

立即学习 516次学习
简单聊聊mysql8与网络通信

如有问题加微信：Le-studyg；在课程中，我们将首先介绍MySQL8的新特性，包括性能优化、安全增强、新数据类型等，帮助学生快速熟悉MySQL8的最新功能。接着，我们将深入解析MySQL的网络通信机制，包括协议、连接管理、数据传输等，让

立即学习 500次学习
JavaScript正则表达式基础与实战

在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。

立即学习 487次学习
从零制作响应式网站—Grid布局

本系列教程将展示从零制作一个假想的网络科技公司官网，分为导航，轮播，关于我们，成功案例，服务流程，团队介绍，数据部分，公司动态，底部信息等内容区块。网站整体采用CSSGrid布局，支持响应式，有流畅过渡和展现动画。

立即学习 485次学习