Java字符串去重与字符统计方法
时间:2025-09-30 16:36:36 403浏览 收藏
还在为Java字符串去重和字符统计烦恼吗?本文将带你掌握高效的Java字符串去重技巧,并提供计算字符串数组中共享字符数量的实用方法。通过HashSet实现字符串去重,结合完整Java代码示例,深入讲解字符精确匹配与计数逻辑。教程针对如何优化字符串处理任务进行了性能考量,助力开发者提升代码效率。例如,给定目标字符串"iyee"和字符串数组["hi", "bye", "bebe"],我们将学习如何获得预期输出[1, 2, 1]。无论你是Java新手还是经验丰富的开发者,都能从中受益,轻松应对字符串处理难题。

1. 引言
在字符串处理的场景中,我们经常会遇到需要去除字符串中重复字符的需求。在此基础上,有时还需要进一步分析不同字符串之间共享字符的情况。本教程将解决一个具体问题:给定一个目标字符串 B 和一个字符串数组 a,我们需要完成以下任务:
- 对目标字符串 B 进行字符去重。
- 对数组 a 中的每个字符串元素进行字符去重。
- 计算去重后的 a 数组中每个元素与去重后的 B 字符串之间共享的字符数量,并将这些计数按序存储在一个整数数组中返回。
例如,如果输入 B = "iyee" 和 a = ["hi", "bye", "bebe"],则预期输出为 [1, 2, 1]。
2. 核心概念:字符串字符去重
字符串字符去重是解决此问题的首要步骤。其目标是从字符串中提取所有不重复的字符,并以新的字符串形式返回。
2.1 基于 HashSet 的去重方法
HashSet 是 Java 集合框架中一个非常实用的数据结构,它只存储唯一的元素。利用这一特性,我们可以高效地实现字符串字符去重。
原理: 遍历输入字符串的每一个字符。将每个字符尝试添加到 HashSet 中。由于 HashSet 不允许重复元素,只有首次遇到的字符才能成功添加。同时,我们将成功添加的字符追加到一个 StringBuilder 中,最终 StringBuilder 构造出的字符串就是去重后的结果。
示例代码:dist 方法
import java.util.HashSet;
import java.util.Set;
public class StringProcessor {
/**
* 对输入字符串进行字符去重,返回只包含不重复字符的新字符串。
*
* @param s 待去重的字符串。
* @return 去重后的字符串。
*/
public static String dist(String s) {
StringBuilder sb = new StringBuilder();
Set<Character> set = new HashSet<>();
for (int i = 0; i < s.length(); i++) {
char currentChar = s.charAt(i);
// 如果字符成功添加到Set中(即之前未出现过),则追加到StringBuilder
if (set.add(currentChar)) {
sb.append(currentChar);
}
}
return sb.toString();
}
// ... 其他方法 ...
}解释:
- StringBuilder sb = new StringBuilder();:用于高效地构建新的去重字符串。
- Set
set = new HashSet<>();:用于存储已遇到的唯一字符。set.add(currentChar) 方法在元素不存在时返回 true 并添加,存在时返回 false。
3. 字符匹配与计数策略
在完成字符串去重后,下一步是计算去重后的字符串数组元素与去重后的目标字符串之间共享的字符数量。这本质上是计算两个字符集合的交集大小。
策略: 假设我们有两个去重后的字符串 S1 和 S2。为了计算它们共享的字符数量,我们可以遍历 S1 中的每一个字符,然后检查这个字符是否存在于 S2 中。如果存在,则计数器加一。
示例: 如果 distinctB 是 "iye",distinctArr[i] 是 "hi":
- 遍历 distinctB:
- 字符 'i':distinctArr[i] ("hi") 包含 'i' 吗? 是。计数 = 1。
- 字符 'y':distinctArr[i] ("hi") 包含 'y' 吗? 否。
- 字符 'e':distinctArr[i] ("hi") 包含 'e' 吗? 否。 最终计数为 1。
4. 完整实现教程
现在我们将上述概念整合到一个完整的 Java 方法中。
import java.util.Arrays; // 引入Arrays用于打印结果,实际业务逻辑中可省略
public class StringProcessor {
/**
* 对输入字符串进行字符去重,返回只包含不重复字符的新字符串。
* 此方法已在前面详细解释。
*/
public static String dist(String s) {
StringBuilder sb = new StringBuilder();
Set<Character> set = new HashSet<>();
for (int i = 0; i < s.length(); i++) {
char currentChar = s.charAt(i);
if (set.add(currentChar)) {
sb.append(currentChar);
}
}
return sb.toString();
}
/**
* 处理字符串数组,对其元素和目标字符串进行去重,并计算共享字符数量。
*
* @param b 目标字符串。
* @param a 字符串数组。
* @return 一个整数数组,其中每个元素表示对应去重后的a[i]与去重后的b之间共享的字符数量。
*/
public static int[] mathProfessor(String b, String[] a) {
// 1. 对目标字符串b进行字符去重
String distinctB = dist(b);
// 2. 初始化用于存储去重后的a数组元素和最终计数的数组
String[] distinctArrayElements = new String[a.length];
int[] countArray = new int[a.length];
// 3. 对字符串数组a中的每个元素进行字符去重
for (int i = 0; i < a.length; i++) {
distinctArrayElements[i] = dist(a[i]);
}
// 4. 进行字符匹配与计数
int currentCount = 0;
for (int i = 0; i < distinctArrayElements.length; i++) { // 遍历去重后的a数组中的每个元素
String currentDistinctElement = distinctArrayElements[i];
for (int j = 0; j < distinctB.length(); j++) { // 遍历去重后的目标字符串b的每个字符
char charFromDistinctB = distinctB.charAt(j);
// 检查当前distinctB的字符是否包含在currentDistinctElement中
if (currentDistinctElement.contains(Character.toString(charFromDistinctB))) {
currentCount++;
}
}
// 存储当前元素的计数,并重置计数器
countArray[i] = currentCount;
currentCount = 0;
}
return countArray;
}
public static void main(String[] args) {
String inputB = "iyee";
String[] inputA = {"hi", "bye", "bebe"};
int[] result = mathProfessor(inputB, inputA);
System.out.println("输入B: \"" + inputB + "\"");
System.out.println("输入A: " + Arrays.toString(inputA));
System.out.println("输出结果: " + Arrays.toString(result)); // 预期输出: [1, 2, 1]
String inputB2 = "apple";
String[] inputA2 = {"banana", "orange", "grape"};
int[] result2 = mathProfessor(inputB2, inputA2);
System.out.println("\n输入B: \"" + inputB2 + "\"");
System.out.println("输入A: " + Arrays.toString(inputA2));
System.out.println("输出结果: " + Arrays.toString(result2)); // 预期输出: [2, 2, 1] (distinctB="aple", distinctA=["ban", "orag", "grape"])
// 'a', 'p', 'l', 'e'
// "ban": 'a' (1) -> 1
// "orag": 'a', 'e' (2) -> 2
// "grape": 'a', 'p', 'e' (3) -> 3. Oh wait, my manual check for distinctA2 is wrong.
// distinctA2 = ["ban", "orage", "grape"]
// Let's re-evaluate:
// distinctB = "aple"
// distinctA[0] = "ban" -> 'a' in "aple"? Yes. 'p' in "ban"? No. 'l' in "ban"? No. 'e' in "ban"? No. Count = 1.
// distinctA[1] = "orage" -> 'o' in "aple"? No. 'r' in "aple"? No. 'a' in "aple"? Yes. 'g' in "aple"? No. 'e' in "aple"? Yes. Count = 2.
// distinctA[2] = "grape" -> 'g' in "aple"? No. 'r' in "aple"? No. 'a' in "aple"? Yes. 'p' in "aple"? Yes. 'e' in "aple"? Yes. Count = 3.
// So, result2 should be [1, 2,今天关于《Java字符串去重与字符统计方法》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
451 收藏
-
242 收藏
-
243 收藏
-
450 收藏
-
271 收藏
-
149 收藏
-
267 收藏
-
220 收藏
-
337 收藏
-
470 收藏
-
361 收藏
-
175 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习