登录
首页 >  文章 >  java教程

Java字符串常用方法全解析

时间:2026-05-08 19:38:19 479浏览 收藏

Java字符串看似简单,实则暗藏诸多易被忽视的陷阱:从trim()对中文空格失效、split()默认丢弃末尾空串,到substring()索引越界风险、+拼接在循环中的性能灾难,再到emoji等Unicode补充字符引发的代理对问题——所有异常行为的根源都在于String的不可变性。掌握这些关键细节,不仅能避免低级Bug,更能写出更健壮、高效、国际化友好的Java代码。

在Java中String类常见方法如何使用_Java字符串处理API解析

Java 中 String 是不可变的,所有“修改”操作都返回新对象——这是绝大多数方法行为异常的根本原因。

为什么 trim() 不去掉中文空格?

trim() 只移除 ASCII 空白字符(U+0000 到 U+0020),不处理全角空格(U+3000)、不间断空格(U+00A0)或零宽空格(U+200B)等。

  • replaceAll("^\\s+|\\s+$", "") 配合 Pattern.UNICODE_CHARACTER_CLASS 更可靠
  • 若需兼容全角空格,可写: str.replaceAll("^[\\s\u3000]+|[\\s\u3000]+$", "")
  • 注意:正则中的 \\s 默认不包含 U+3000,必须显式添加

split() 的坑:空字符串和负数 limit

split(String regex) 默认丢弃末尾空串;split(String regex, int limit)limit 为负数时才保留全部分割结果(包括结尾空串)。

  • "a,b,c,".split(",")["a", "b", "c"](长度 3,末尾空串被丢)
  • "a,b,c,".split(",", -1)["a", "b", "c", ""](长度 4)
  • 正则中点号 .、星号 * 必须转义:str.split("\\.")
  • 避免用 split("") 拆字符——应改用 toCharArray()codePoints().toArray()

substring() 的索引边界容易抛 StringIndexOutOfBoundsException

两个参数分别是起始索引(含)和结束索引(不含),但结束索引可以等于字符串长度,不能超过。

  • "abc".substring(1, 3)"bc"
  • "abc".substring(1, 4) → 抛异常 ❌(最大合法 end 是 3)
  • "abc".substring(3, 3) → 返回空字符串 "" ✅(合法)
  • 建议配合 Math.min(end, str.length()) 做防御性截取

性能敏感场景慎用 + 拼接大量字符串

编译器会对常量拼接优化(如 "a" + "b""ab"),但运行时循环中用 += 会反复创建新 String 对象。

  • 循环内拼接优先用 StringBuildersb.append(str)
  • String.join(", ", list) 比手写循环拼接更简洁且已优化
  • JDK 9+ 中 String.concat()+ 略快(底层复用数组),但仍不如 StringBuilder 适合多次追加

真正麻烦的是 Unicode 补充字符(如 emoji ?‍?),它们占两个 char(代理对),length()charAt() 会出错;需要用 codePointCount()offsetByCodePoints()chars()/codePoints() 流式处理。

好了,本文到此结束,带大家了解了《Java字符串常用方法全解析》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多文章知识!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>