登录
首页 >  文章 >  php教程

提取一位数和两位数的正则表达式是:\b\d{1,2}\b,用于匹配独立的1到2位数字。例如在字符串"abc123def45gh6"中,将匹配到"12"、"45"、"6"。若需更严格匹配,可使用更复杂的表达式如(?

时间:2026-03-25 20:39:44 293浏览 收藏

本文深入解析了如何巧妙运用正则表达式的零宽先行断言(如(?=((\d)\d?)))实现对连续数字字符串的“无消耗滑动扫描”,从而完整、无重叠、无遗漏地提取所有1位和2位数字子串——例如从"12345"中精准捕获[1,2,3,4,5,12,23,34,45],彻底规避传统贪婪/懒惰匹配导致的跳位与重复问题;文章不仅给出可直接运行的PHP代码与清晰分组逻辑(利用捕获组差异自动判别单双位数),还阐明了PREG_SET_ORDER的关键作用、扩展至多位数的方法及O(n)高效性,堪称正则高级技巧解决实际字符串切片难题的典范实践,让读者一眼掌握从“匹配字符”到“感知位置”的思维跃迁。

提取字符串中所有一位数与两位数子串的正则匹配方法

本文介绍如何使用正则表达式(配合零宽断言)在连续数字字符串中无遗漏、无重叠地提取所有1位和2位数字子串,如从"12345"中完整获取[1,2,3,4,5,12,23,34,45],并解析实现逻辑与关键注意事项。

本文介绍如何使用正则表达式(配合零宽断言)在连续数字字符串中无遗漏、无重叠地提取所有1位和2位数字子串,如从"12345"中完整获取[1,2,3,4,5,12,23,34,45],并解析实现逻辑与关键注意事项。

在处理数字序列时,常规贪婪或懒惰匹配(如 \d|\d\d 或 \d(\d)?)往往因匹配机制导致重叠遗漏或顺序错乱——例如对 "12345" 使用 \d(\d)? 会得到 ["12","2","34","3","5"],这是因为正则引擎在匹配完 "12" 后,指针已移至位置2,跳过了以索引1开头的 "23" 等有效子串。

根本解法是避免消耗字符,改用正向先行断言(lookahead) 实现“滑动窗口”式扫描。核心正则为:(?=((\d)\d?)):

  • (?=...) 是零宽正向先行断言,不消耗输入位置,允许在同一位置多次尝试匹配;
  • 内部 ((\d)\d?) 捕获一个或两个连续数字到捕获组1($m[1]),同时将首位数字单独捕获到组2($m[2]);
  • 当组1与组2内容相等(如匹配到单个 "5"),说明只捕获了1位数;否则为2位数(如 "12" 中 $m[1]="12", $m[2]="1")。

以下是完整、可运行的 PHP 实现:

$s = "12345";
$res = [];
if (preg_match_all('~(?=((\d)\d?))~', $s, $m, PREG_SET_ORDER)) {
    $single = [];
    $double = [];
    foreach ($m as $v) {
        if ($v[1] !== $v[2]) {
            $single[] = $v[2];   // 单数字:取组2(首位)
            $double[] = $v[1];   // 双数字:取组1(完整匹配)
        } else {
            $single[] = $v[1];    // 纯单数字情况(如末位"5")
        }
    }
    $res = array_merge($single, $double);
}
print_r($res);
// 输出:Array ( [0]=>1 [1]=>2 [2]=>3 [3]=>4 [4]=>5 [5]=>12 [6]=>23 [7]=>34 [8]=>45 )

关键要点说明

  • 必须使用 PREG_SET_ORDER 标志,确保每次匹配结果以独立子数组形式组织($m[i][0]为全匹配,$m[i][1]为组1,$m[i][2]为组2),便于逐项判别;
  • 不可省略组2的显式捕获 (\d):它是区分单/双数字的唯一依据;
  • 此方案天然支持任意长度纯数字字符串(如 "9876" → [9,8,7,6,98,87,76]),且时间复杂度为 O(n),高效稳定;
  • 若需扩展至3位数,可调整为 (?=((\d)\d{0,2})) 并增加分支判断,但需注意组结构变化。

该方法突破了传统“匹配即消耗”的局限,体现了正则高级特性在字符串切片类问题中的精准控制力,是算法与正则协同设计的典型实践。

今天带大家了解了的相关知识,希望对你有所帮助;关于文章的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>