登录
首页 >  文章 >  linux

LinuxShell字符串处理技巧大全

时间:2026-05-11 10:04:53 344浏览 收藏

本文深入解析了Linux Shell中高效安全的字符串操作技巧,重点介绍Bash原生参数扩展(如${#string}取长度、${string#pattern}删前缀、${string:offset:length}截取)如何以零进程开销、强容错性及对特殊字符/Unicode的天然支持,全面碾压传统expr、sed等外部命令方案——既避免fork性能损耗,又杜绝因换行、空格或emoji引发的解析错误,是Shell脚本编写者提升效率与健壮性的必备核心技能。

Linux如何使用Shell字符串操作_Linux Shell字符串操作解析

${#string} 能直接取长度,${string#pattern} 可删前缀,${string:offset:length} 支持灵活截取——这些 Bash 内置参数扩展比 expr 更快、更安全,也无需额外进程开销。

怎么用 ${#string} 获取字符串长度

这是最轻量、最推荐的方式。Bash 原生支持,不启动子进程,无空格/特殊字符解析风险。

  • ${#string} 中的 string 必须是已定义变量名,不能是字面值(如 ${#"abc"} 会报错)
  • 变量未定义或为空时,结果为 0,不会报错
  • 注意:它统计的是字符数,不是字节数;含中文或 emoji 时,UTF-8 编码下仍按字符计(Bash 5.0+ 默认行为)
  • 别写成 expr length "$string" ——多一次 fork,且当 $string 含换行或特殊字符时易出错

怎么删掉字符串开头的固定前缀

${var#prefix}${var##prefix},本质是模式匹配删除,不是正则。

  • ${var#test-} 删除最短匹配的 test-(只删一次,哪怕开头有多个 test-
  • ${var##test-} 删除最长匹配(即贪心删到最后一个 test- 出现的位置)
  • 如果 $var 不以 test- 开头,原值不变,不会报错或变空
  • 前缀中可含通配符:${var#file*.log} 会删掉从 file 开始、到第一个 .log 结束的最短部分
  • 别用 sed 's/^test-//' <<< "$var" ——重了,还可能因 $var 含斜杠或 & 导致意外替换

怎么从指定位置截取子串

${string:offset}${string:offset:length} 是最常用截取方式,下标从 0 开始(注意:和 expr substr 的 1 起始不同)。

  • ${string:3} 从第 4 个字符起截到末尾(等价于 ${string:3:${#string}}
  • ${string: -2} 注意空格:-2 前必须有空格,表示倒数第 2 个字符起(即取最后两个)
  • ${string:(-2)} 括号写法可省略空格,语义相同,但某些老版本 Bash(如 3.x)不支持
  • 超出范围不报错:若 offset 超长,结果为空;若 length 超出剩余长度,自动截断到末尾
  • 避免用 expr substr "$string" 4 3 ——它下标从 1 开始,易混淆;且 expr 对空格和换行敏感,脚本健壮性差

为什么别轻易用 expr 处理字符串

expr 是外部命令,每次调用都 fork 新进程,性能低;更重要的是它对空格、反斜杠、括号等极其脆弱。

  • expr length "$string" 中,若 $string"a b c"expr 会把空格当分隔符,实际只收到 a,返回长度 1
  • expr match "$string" ".*" 依赖正则引擎,而不同系统 expr 实现有差异(如 GNU vs BSD),.* 在某些版本里不匹配换行
  • expr index "$string" "$char"$char/.,需额外转义,易漏
  • Bash 内置扩展全部在当前 shell 进程内完成,无环境依赖,也无词法分割风险

真正容易被忽略的是:所有这些 ${...} 操作都要求变量名真实存在。如果写成 ${undef_var#prefix},它就按空字符串处理——这有时是预期行为,有时却是隐藏 bug 的根源,尤其在条件判断中要格外留神变量是否真被赋过值。

今天关于《LinuxShell字符串处理技巧大全》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于的内容请关注golang学习网公众号!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>