登录
首页 >  文章 >  java教程

Java字符串方法大全及使用技巧

时间:2026-02-14 21:48:46 121浏览 收藏

本文深入剖析了Java字符串四大核心方法(isBlank/isEmpty、substring、split、拼接操作)在不同JDK版本中的行为差异、常见陷阱与性能优化策略:从Java 11新增的Unicode感知空白判断,到substring因内存泄漏问题历经“共享→复制→紧凑字节数组”的三次架构演进;从split默认丢弃末尾空串的隐式规则及其正则转义要点,到拼接场景下+、StringBuilder、String.join的适用边界与线程安全考量——每处看似简单的API背后,都凝结着版本兼容性、内存管理、编码规范与真实业务场景的深度权衡,帮你避开线上故障高发区。

在Java中String类有哪些常用方法_Java字符串操作解析

如何判断字符串是否为空或只包含空白字符

isEmpty() 判断长度是否为 0,但要注意它不处理空格;真正安全的写法是先用 isBlank()(Java 11+)——它会把 "\t\n " 这类也算作“空白”。Java 8 及以前得手动写 str == null || str.trim().isEmpty(),但要注意 trim()null 会抛 NullPointerException,所以必须先判空。

  • isEmpty():仅检查 length == 0,速度快,但对 " " 返回 false
  • isBlank():Java 11 引入,内部调用 chars().allMatch(Character::isWhitespace),兼容 Unicode 空白符(如  、 )
  • 老版本替代方案务必写成 str != null && str.trim().isEmpty(),顺序不能反

为什么 substring() 在 Java 7u6 之后性能变差又变好

Java 7u6 前,substring() 复用原字符串的 char[] 数组,内存不释放(大字符串截一小段,原数组仍被引用);7u6 到 Java 8 中改成了「复制新数组」,解决内存泄漏但带来额外开销;Java 9 起改用 byte[] + 编码标记,substring() 再次变成 O(1) 时间且无共享数组风险。

  • Java 8 下大量调用 substring() 可能引发 GC 压力,尤其从长日志中反复提取字段时
  • 如果确定子串生命周期短于原串,可考虑用 String.valueOf(charArray, offset, count) 避免构造中间 String
  • 注意 substring(beginIndex, endIndex) 的 endIndex 是「不包含」的,越界直接抛 StringIndexOutOfBoundsException

split() 的坑:为什么 "a..b".split("\\.") 返回长度为 3 的数组

split() 默认丢弃末尾空字符串,但遇到连续分隔符时,中间的空串会被保留。上面例子中正则 "\\." 匹配点号,"a..b" 拆成 ["a", "", "b"] —— 因为两个点号之间有长度为 0 的子串。

  • 想连末尾空串也保留?加负数 limit:"a.b.".split("\\.", -1)["a", "b", ""]
  • 想彻底忽略所有空结果?自己过滤:Arrays.stream(str.split("\\.")).filter(s -> !s.isEmpty()).toArray(String[]::new)
  • 注意 .*+ 等在正则里有特殊含义,必须转义,直接写 "." 会匹配任意字符

字符串拼接选 +StringBuilder 还是 String.join()

编译期能确定的字面量拼接(如 "a" + "b" + "c")会被 javac 优化成单个常量;运行期变量拼接,简单两三个用 + 也没问题(JDK 9+ 的 StringConcatFactory 会自动转成 StringBuilder);但循环内拼接必须用 StringBuilder,否则每轮都新建对象。

  • 连接带分隔符的集合,优先用 String.join(", ", list),比手写循环 + StringBuilder 更简洁且已做空值防护
  • StringBuilder.append()+= 快一个数量级(10k 次拼接测试),尤其在嵌套循环中
  • 多线程环境别共用同一个 StringBuilder 实例,没同步保障;需要线程安全就换 StringBuffer,但代价是性能下降约 20%
Java 字符串方法看着简单,但每个背后都有版本演进、边界条件和性能权衡。最常被忽略的是:方法是否接受 null、是否区分 Unicode 字符(比如 length() 返回的是 UTF-16 code unit 数,不是真实字符数)、以及正则相关方法默认使用的是 JVM 默认编码还是平台无关逻辑。

到这里,我们也就讲完了《Java字符串方法大全及使用技巧》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于的知识点!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>