登录
首页 >  文章 >  前端

如何利用正则表达式实现对原始 SQL 语句中关键条件的解析与提取

时间:2026-05-24 23:27:24 181浏览 收藏

知识点掌握了,还需要不断练习才能熟练运用。下面golang学习网给大家带来一个文章开发实战,手把手教大家学习《如何利用正则表达式实现对原始 SQL 语句中关键条件的解析与提取》,在实现功能的过程中也带大家重新温习相关知识点,温故而知新,回头看看说不定又有不一样的感悟!

正则表达式适合轻量级SQL条件提取,如WHERE子句及AND/OR拆分、操作符右侧值解析,但不适用于嵌套括号、注释或动态SQL;应优先使用sqlparse等专用解析器。

如何利用正则表达式实现对原始 SQL 语句中关键条件的解析与提取

正则表达式可用于快速提取 SQL 语句中关键条件(如 WHEREANDORINLIKE 等子句),但需注意其适用边界:它适合轻量级、格式较规范的 SQL 解析,不适用于嵌套复杂、含注释或动态拼接的语句。真正健壮的解析应使用专用 SQL 解析器(如 sqlparse、JSqlParser),正则更适合预处理、日志分析或规则简单场景。

提取 WHERE 子句整体内容

多数情况下,我们先定位 WHERE 起始位置,再捕获其后直到语句结束(或遇到分号、ORDER BY、GROUP BY 等关键词)的内容:

  • 基础模式:/WHERE\s+((?:[^;]|;\s*(?!$))*?)(?=\s+(?:ORDER\s+BY|GROUP\s+BY|HAVING|LIMIT|;|$))/i
  • 说明:匹配 WHERE 后所有非终止关键词的字符,支持跨行(需开启 dotall 模式),避免被子查询或括号干扰(但无法完美处理嵌套括号)
  • 建议:实际使用时先用 re.IGNORECASE | re.DOTALL 标志,并对结果做空白清理(.strip()

拆分 AND/OR 连接的独立条件

在已提取的 WHERE 内容中,按逻辑连接词切分条件,需小心处理括号和字符串字面量(正则难以完全规避误切,可先简单过滤):

  • 推荐模式:/\s+(AND|OR)\s+/i 用于 split(),但保留分隔符更稳妥:/(\s+(AND|OR)\s+)/i
  • 更安全做法:用 re.findall(r'(\([^()]*\)|[^ANDOR;]+)+', where_body, re.I) 粗略跳过括号内内容(仅单层),再逐段清洗
  • 示例输入:age > 18 AND name LIKE '%li%' OR status IN (1,2) → 可得三段:'age > 18''name LIKE \'%li%\'''status IN (1,2)'

提取常见操作符右侧值(=、IN、LIKE、BETWEEN)

针对单个条件片段,用针对性正则提取字段名、操作符与值,尤其注意引号包裹的字符串和括号列表:

  • = 值/(\w+)\s*=\s*(['"]?)([^'"]+)\2/i(支持带/不带引号的右值)
  • IN 列表/IN\s*\(\s*([^)]+)\s*\)/i,再对 $1 按逗号分割并去空格
  • LIKE 模式/LIKE\s+(['"])(.*?)\1/i,捕获 $2 即通配内容(如 %abc%
  • BETWEEN/BETWEEN\s+([^ ]+)\s+AND\s+([^ ]+)/i(简化版,未处理引号)

注意事项与局限性

正则解析 SQL 是“够用就好”的权衡,以下情况会失效或需额外处理:

  • 嵌套括号:如 WHERE (a = 1 AND (b = 2 OR c = 3)),普通正则无法正确配对
  • SQL 注释:行内 -- 或块注释 /* ... */ 会干扰匹配,建议先移除注释
  • 字符串中的关键词:如 name = 'OR logic' 可能被误识别为逻辑运算符
  • 大小写混用、多余空格、换行、制表符等格式差异,需在正则中充分适配(\s*re.I
  • 不支持参数化占位符解析(如 ?:id),需结合上下文补充

如果目标是审计、脱敏或规则引擎匹配,正则快而直接;若涉及语法验证、重写或深度分析,务必转向专业解析库。正则只是起点,不是终点。

本篇关于《如何利用正则表达式实现对原始 SQL 语句中关键条件的解析与提取》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于文章的相关知识,请关注golang学习网公众号!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>