登录
首页 >  文章 >  java教程

可以使用 FileSystems.getDefault().getPathMatcher() 来实现类似通配符的文件名匹配,主要通过定义一个符合 glob 语法的模式字符串。以下是详细步骤和示例代码:✅ 一、理解 PathMatcherPathMatcher 是 Java NIO 中用于匹配路径的接口,它支持 glob 模式(类似于 shell 中的通配符),例如:*.txt:匹配所有 .txt

时间:2026-05-14 20:06:51 356浏览 收藏

Java NIO 的 `PathMatcher` 是一个轻量高效的路径匹配工具,支持 `glob:` 和 `regex:` 两种语法:`glob:` 适用于简单文件名匹配(如 `*.txt`、`??.java`),但严格限制为单层通配(不支持 `**` 递归)、路径分隔符必须用 `/`,且 `matches()` 实际只作用于文件名而非全路径;而 `regex:` 则用于复杂场景,如跨目录匹配、路径段模式或否定逻辑,但需注意字符串转义、分隔符兼容性及性能开销。正确使用的关键在于理解匹配目标(文件名 vs 全路径)、避免重复创建实例、配合 `getFileName()` 提取匹配单元,并在递归遍历时优先选用 `Files.walk()` 或 `Files.find()` 配合显式文件名提取——掌握这些细节,才能让文件筛选既精准又高效。

怎么利用 FileSystems.getDefault().getPathMatcher() 实现类似通配符的文件名匹配

getPathMatcher() 支持哪些通配语法?

FileSystems.getDefault().getPathMatcher() 不支持 Shell 风格的 **(递归 glob),也不支持正则表达式裸写——它只认两种 scheme:glob:regex:。默认前缀是 glob:,所以 "*.txt" 等价于 "glob:*.txt"。常见误区是以为 **/*.java 能跨目录匹配,实际会抛 java.nio.file.InvalidPathException

真正可用的 glob 元符只有三个:

  • *:匹配当前目录下任意数量非 / 字符(不跨目录)
  • ?:匹配单个非 / 字符
  • [a-z][!0-9]:字符类,注意不支持 [^0-9]

路径分隔符必须用 /(Windows 上也强制用正斜杠),例如 "glob:src/main/**/*.java" 是非法的;正确写法是分两步:先用 Files.walk() 遍历目录,再对每个 Path.getFileName() 单独 matcher。

如何正确构造并复用 PathMatcher 实例?

每次调用 getPathMatcher("glob:*.log") 都会新建对象,但 matcher 本身是无状态的,可以安全复用。别在循环里反复创建——尤其在过滤成千上万个文件时,实测能减少 10%+ GC 压力。

典型用法:

PathMatcher matcher = FileSystems.getDefault().getPathMatcher("glob:*.sql");
for (Path path : paths) {
    if (matcher.matches(path.getFileName())) { // 注意:传的是文件名,不是全路径
        System.out.println(path);
    }
}

关键点:

  • matcher.matches() 接收的是 Path 对象,但逻辑上只检查其最后一段(即文件名),和路径层级无关
  • 如果想匹配完整路径(如 "config/dev/*.yml"),得先用 path.toString()path.normalize() 转成字符串,再用 regex: scheme(见下一条)
  • matcher 实例线程安全,可作为类字段或静态常量缓存

什么时候必须切到 regex: scheme?

当需要匹配路径中某一段含特定模式(比如 "logs/error-2024-*.log")、或要跨级匹配(如 "**/target/**/*.jar")、或需否定逻辑(如 “非 .tmp 结尾”)时,glob: 无能为力,必须用 regex:

注意:regex: 接收的是路径的字符串表示(path.toString()),且默认以 ^ 开头、$ 结尾,所以写 "regex:.*\\.log" 就够了,不用手动加锚点。

示例:

PathMatcher matcher = FileSystems.getDefault().getPathMatcher(
    "regex:.*[/\\\\]target[/\\\\].*\\.jar"); // 同时兼容 / 和 \ 分隔符
if (matcher.matches(path)) { ... }

坑点:

  • Java 字符串里反斜杠要双写,正则里又要双写,所以 \\ 写成 "\\\\"
  • Windows 路径可能含 \,用 path.toString().replace('\\', '/') 统一更稳妥
  • regex 匹配开销比 glob 高,高频场景建议预编译 Pattern 缓存,而非依赖 PathMatcher

为什么 Files.find() + PathMatcher 组合容易漏文件?

直接写 Files.find(root, 3, (p, a) -> matcher.matches(p)) 很诱人,但错在:matcher 检查的是全路径 p,而 glob 规则(如 "*.md")只设计用于匹配文件名。结果是只有根目录下的 .md 文件被命中,子目录里的全失效。

正确姿势是显式提取文件名:

Files.find(root, 3,
    (p, a) -> matcher.matches(p.getFileName())) // ← 关键!用 getFileName()
    .forEach(System.out::println);

或者用 Files.walk() 手动控制:

try (Stream<path> stream = Files.walk(root)) {
    stream.filter(p -> !Files.isDirectory(p))
          .filter(p -> matcher.matches(p.getFileName()))
          .forEach(...);
}</path>

额外提醒:如果 root 本身是文件(非目录),Files.walk() 会抛 NotDirectoryException,务必提前 Files.isDirectory(root) 校验。

到这里,我们也就讲完了《可以使用 FileSystems.getDefault().getPathMatcher() 来实现类似通配符的文件名匹配,主要通过定义一个符合 glob 语法的模式字符串。以下是详细步骤和示例代码:✅ 一、理解 PathMatcherPathMatcher 是 Java NIO 中用于匹配路径的接口,它支持 glob 模式(类似于 shell 中的通配符),例如:*.txt:匹配所有 .txt 文件??.java:匹配两个字符后缀为 .java 的文件data/*:匹配 data 目录下的所有文件✅ 二、创建 PathMatcher import java.nio.file.*; import java.io.IOException; public class PathMatcherExample { public static void main(String[] args) throws IOException { // 定义 glob 模式 String pattern = "data/*.txt"; // 匹配 data 目录下所有 .txt 文件 // 获取默认文件系统 FileSystem fs = FileSystems.getDefault(); // 创建 PathMatcher 实例 PathMatcher matcher = fs.getPathMatcher("glob:" + pattern); // 遍历目录并检查文件是否匹配 Path dir = Paths.get("data"); Files.list(dir) .filter(path -> matcher.matches(path)) .forEach(System.out::println); } } ``》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于的知识点!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>