Linux部署Node-Exporter+Grafana监控教程
时间:2026-05-23 19:51:19 146浏览 收藏
本文深入解析了Linux环境下部署Node-Exporter与Grafana构建主机监控系统的完整链路与高频踩坑点,明确指出该监控组合必须依赖Prometheus作为核心数据采集与存储枢纽——Node-Exporter负责在被监控物理机本地暴露硬件指标(默认:9100),Prometheus负责远程抓取并存储时序数据,Grafana仅作为可视化层查询渲染;文章直击三大典型故障场景:node_exporter启动后/metrics为空的深层原因(SELinux拦截、内核模块缺失、端口冲突、路由前缀误配)、Prometheus targets配置中localhost语义混淆导致抓取失败、以及Grafana面板“No data”背后的指标缺失、job/instance标签不匹配和scrape间隔不合理等关键细节,并给出精准可操作的排查命令与修复方案,助你避开90%的部署陷阱,快速搭建稳定可靠的Linux主机监控体系。

Node-Exporter 必须运行在被监控物理机本地,且默认监听 :9100;Grafana 本身不采集数据,只负责从 Prometheus 查询并渲染图表——所以“Node-Exporter + Grafana”这个组合缺了 Prometheus 就完全跑不起来。
node_exporter 启动后访问 http://localhost:9100/metrics 返回空或 404
这不是 Grafana 的问题,而是 node_exporter 没真正提供指标。常见原因有:
- 进程启动失败但没报错:用
ps aux | grep node_exporter确认进程是否存在;若无,检查是否被 SELinux 或防火墙拦截(setsebool -P prometheus_can_network on或临时setenforce 0) - 二进制权限问题:某些系统(如 CentOS 7)需加
--no-collector.wifi --no-collector.xfs避免因内核模块缺失导致启动卡住 - 端口被占用:
lsof -i :9100查看冲突进程,改用--web.listen-address=":9101"换端口 - 指标路径不是
/metrics:确认没误加--web.route-prefix,否则真实路径会变成/prefix/metrics
prometheus.yml 中 targets 写 localhost:9100 却抓不到数据
Prometheus 默认从自身所在机器发起抓取请求,localhost 指的是 Prometheus 进程所在的机器,不是被监控的物理机。部署时容易混淆这点:
- 如果 Prometheus 和 node_exporter 在同一台物理机:用
localhost:9100是对的 - 如果 Prometheus 装在 A 机,node_exporter 装在 B 机(典型物理机监控场景):
targets必须写 B 机的真实 IP,例如['192.168.1.102:9100'],不能写localhost - 确保 B 机的
firewalld或ufw放行9100端口(firewall-cmd --permanent --add-port=9100/tcp) - 抓取失败时,去 Prometheus UI 的
Status > Targets页面看具体错误(如connection refused或timeout)
Grafana 添加 Prometheus 数据源后测试成功,但导入面板显示 “No data”
这说明连接通了,但查询不到有效时间序列。重点排查指标是否存在和标签匹配:
- 先在 Prometheus UI 的 Graph 页面手动执行
node_cpu_seconds_total,看是否有结果;没有就说明 node_exporter 根本没上报成功 - 检查 job 名称和 instance 标签是否与面板 JSON 中的变量一致:比如面板里写的是
job="linux",但你的prometheus.yml里是job_name: "physical-server",就会查不到 - 部分旧版 Grafana 面板(如 ID 1860)默认用
instance=~".*",而新版本 node_exporter 可能带上了主机名+端口(如host.example.com:9100),需要改成instance=~".+:9100"或直接删掉该过滤条件 - 确认 scrape_interval 设置合理(建议 ≤30s),太长会导致首次加载延迟明显
最容易被忽略的一点:node_exporter 默认不收集某些高开销指标(如 textfile、bonding),但如果你手动启用了 --collector.systemd,却没装 systemd-devel 或权限不足,整个进程可能静默退出——务必用 journalctl -u node_exporter -n 50 看真实日志,别只信 ps 显示在运行。
文中关于的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《Linux部署Node-Exporter+Grafana监控教程》文章吧,也可关注golang学习网公众号了解相关技术文章。
相关阅读
更多>
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
最新阅读
更多>
-
146 收藏
-
456 收藏
-
257 收藏
-
221 收藏
-
134 收藏
-
376 收藏
-
499 收藏
-
412 收藏
-
353 收藏
-
181 收藏
-
420 收藏
-
117 收藏
课程推荐
更多>
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习