首页 > 文章 > java教程

Java如何高效去重整型数组

时间：2026-03-22 19:18:39 286浏览收藏

本文深入剖析了Java中从文件读取非负整数并高效去重填充数组的关键实现细节，直击因布尔标志变量作用域错误（如将isDuplicate声明在循环外）导致的重复判定全面失效这一典型陷阱，并通过将其移至while循环内、配合break优化、严谨异常处理与资源管理等改进，提供了一个逻辑清晰、健壮可复用的O(n²)解决方案；同时贴心提示：面对大规模数据时可升级为HashSet实现O(1)查找，兼顾教学价值与工程实用性。

如何在 Java 中正确去重填充整型数组

本文详解如何通过遍历比对实现文件中非负整数的去重读取与数组填充，重点修复因布尔标志变量作用域错误导致的重复判定失效问题，并提供健壮、可复用的实现方案。

本文详解如何通过遍历比对实现文件中非负整数的去重读取与数组填充，重点修复因布尔标志变量作用域错误导致的重复判定失效问题，并提供健壮、可复用的实现方案。

在 Java 中从文件读取整数并填充至数组时，若需保留唯一值（去重），核心逻辑在于：每读取一个有效整数，需遍历已存入数组的元素进行比对；仅当未发现相同值且数组未满时，才执行写入。然而，原代码中 boolean ID = false 被声明在方法顶部，导致其状态在多次循环中持续累积——一旦某次检测到重复，ID 变为 true 后便无法自动重置，后续所有数字均被误判为重复，最终仅填充 11 个元素（实际应为 10 个唯一值）。

关键修复点在于：将 ID 声明移至 while 循环内部，确保每次处理新数字前其初始值均为 false。以下是修正后的完整实现：

private static int read(String inFileName, int[] list) {
    int size = 0;
    Scanner inFile = null;
    int trash = 0;
    int uniqueCount = 0;
    int dupeCount = 0;
    int lineCount = 0;

    try {
        inFile = new Scanner(new File(inFileName));
        while (inFile.hasNext()) {
            lineCount++;
            boolean isDuplicate = false; // ✅ 每轮重置标志位

            try {
                int val = inFile.nextInt();
                if (val < 0) {
                    trash++;
                    continue;
                }

                // 遍历已存元素，检查是否已存在
                for (int i = 0; i < size; i++) {
                    if (list[i] == val) {
                        isDuplicate = true;
                        dupeCount++;
                        break; // 找到即退出，提升效率
                    }
                }

                // 仅当非重复且数组有空间时写入
                if (!isDuplicate && size < list.length) {
                    list[size] = val;
                    size++;
                    uniqueCount++;
                }

            } catch (InputMismatchException e) {
                trash++;
                inFile.nextLine(); // 清除非法行，避免死循环
            }
        }

        System.out.printf("Lines processed: %d | Unique: %d | Duplicates: %d | Invalid/Negative: %d%n", 
                         lineCount, uniqueCount, dupeCount, trash);

    } catch (FileNotFoundException e) {
        System.err.println("Error: File '" + inFileName + "' not found.");
        return 0;
    } finally {
        if (inFile != null) inFile.close();
    }

    return size;
}

✅ 关键改进说明：

isDuplicate 在每次循环开始时初始化，确保判定逻辑独立、准确；
break 提前终止内层循环，避免冗余比较；
使用 printf 格式化输出，增强可读性；
finally 块中关闭 Scanner，防止资源泄漏；
错误处理更严谨：FileNotFoundException 使用 System.err 输出，区分错误与普通日志。

⚠️ 注意事项：

该方案时间复杂度为 O(n²)，适用于小规模数据（如题中 ≤20 个数）。若文件极大，建议改用 HashSet 缓存已见值，将查找优化至 O(1) 平均时间；
数组长度由用户指定，需确保 list.length ≥ 预期唯一数个数，否则会静默截断；
负数和非整数内容统一归为“trash”，可根据需求扩展为跳过、记录或抛出自定义异常。

综上，正确管理局部变量的作用域是保障逻辑正确性的基础。本实现兼顾清晰性、健壮性与教学示范性，可直接集成至主程序中调用。

今天关于《Java如何高效去重整型数组》的内容介绍就到此结束，如果有什么疑问或者建议，可以在golang学习网公众号下多多回复交流；文中若有不正之处，也希望回复留言以告知！