登录
首页 >  文章 >  linux

Linux下jq解析JSON技巧与实例

时间:2026-04-24 13:36:44 359浏览 收藏

本文系统讲解了 Linux 下使用 jq 工具高效、安全解析 JSON 的核心技巧:从基础字段提取(如处理 null 和缺失字段的 select 与 // 方案)、数组遍历(正确使用 .[] 展开与 ? 静默容错)、精准过滤(has() 判存在、test() 正则匹配、and/or 多条件组合),到结构化输出(-r 参数避免引号干扰、@csv 自动转义、\(.key) 插值与 join() 构造格式化结果),覆盖日常开发中高频踩坑场景,帮你告别手动字符串拼接和管道异常,真正用好 jq 这个 JSON 处理利器。

Linux下使用jq命令解析JSON数据 常用语法与实例

提取单个字段值:用 .key 最直接,但注意 null 和缺失字段的区别

当你执行 jq '.name' data.json,如果 JSON 中没有 name 字段,jq 默认输出 null,而不是报错或跳过。这容易在管道后续处理中引发意外(比如传给 grepawk 时多出一行 null)。

更稳妥的做法是用 select 过滤掉空值:jq -r '.name | select(. != null)' data.json;或者用 // 提供默认值:jq -r '.name // "unknown"' data.json

  • -r 参数必须加,否则字符串带引号,后续 shell 处理会出问题
  • 字段名含连字符(如 user-id)要写成 ."user-id",不能直接点
  • 嵌套对象如 {"user": {"profile": {"age": 30}}},取值写 .user.profile.age,中间任何一层为 null 整体就返回 null

遍历数组:用 [].[] 区分“整个数组”和“每个元素”

常见错误是把 .items 当作数组本身来遍历,结果只输出一次数组结构。真正逐项处理要用 .items[].name —— 后面的 .[] 才是“展开数组”的关键操作符。

例如 JSON 是 {"results": [{"id":1,"v":true}, {"id":2,"v":false}]}

  • jq '.results' file.json → 输出整个数组 [{"id":1,"v":true},...]
  • jq '.results[].id' file.json → 输出两行:1 和 2
  • jq '.results[] | select(.v == true) | .id' file.json → 只输出满足条件的 id(这里是 1)

注意:.[] 对非数组输入(比如对象或字符串)会报错,加 ? 可静默忽略:.items[].name?

过滤与条件判断:select() 是核心,但别忘了它只保留“真值”,不是布尔转换

select(.status == "active") 看似简单,但实际行为取决于 .status 类型:如果是字符串,匹配成功;如果是 null 或缺失字段,整个表达式为 false,该条目被丢弃;如果是数字 1,跟字符串 "active" 比较永远为 false —— jq 不自动类型转换。

  • 多个条件用 and/orselect(.age > 18 and .city == "Beijing")
  • 检查字段是否存在: select(has("email"))select(.email != null) 更准确(后者在 "email": null 时仍为 true
  • 正则匹配用 test()select(.name | test("^A.*"))

误用 select 最常见的坑是:想“排除 null”,却写了 select(.field != null),结果 .field 根本不存在时也返回 null,导致逻辑失效。

格式化与组合输出:用 {}[] 构造新结构,避免拼接字符串

不要用 jq '.name' file.json | sed 's/"//g' 去掉引号,而应直接用 -r + 构造对象。比如想输出 id:name 格式:

jq -r '.results[] | "\(.id):\(.name)"' file.json

更规范的做法是先构造对象再转字符串:

jq -r '.results[] | {id, name} | join(":")' file.json
  • join() 只对数组有效,所以得先用 [.id, .name] 包裹
  • 构造对象 {a: .x, b: .y}{x, y} 更明确,尤其字段名不一致时
  • 输出纯 CSV 且含逗号/换行等特殊字符?jq 本身不转义,建议用 @csvjq -r '[.id, .name] | @csv'

复杂点在于嵌套结构扁平化:比如 .tags 是字符串数组,想每条记录输出多行 tag,得用 .tags[] 展开后再组合,这里容易漏掉层级或重复 .[]

以上就是本文的全部内容了,是否有顺利帮助你解决问题?若是能给你带来学习上的帮助,请大家多多支持golang学习网!更多关于文章的相关知识,也可关注golang学习网公众号。

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>