如何通过静态分析 AST 手动编写一个针对特定业务逻辑的代码脱敏混淆工具
时间:2026-05-02 21:46:05 195浏览 收藏
编程并不是一个机械性的工作,而是需要有思考,有创新的工作,语法是固定的,但解决问题的思路则是依靠人的思维,这就需要我们坚持学习和更新自己的知识。今天golang学习网就整理分享《如何通过静态分析 AST 手动编写一个针对特定业务逻辑的代码脱敏混淆工具》,文章讲解的知识点主要包括,如果你对文章方面的知识点感兴趣,就不要错过golang学习网,在这可以对大家的知识积累有所帮助,助力开发能力的提升。
必须基于 AST 用 @babel/parser + @babel/traverse 安全提取可混淆标识符:仅处理声明绑定(var/let/const/param),跳过属性名、导入绑定和白名单字段,按作用域隔离生成混淆名,并用 replaceWith 更新引用。

直接在字符串层面做正则替换会误伤 console.log、JSON.parse、对象属性名和动态引用,必须基于 AST 才能精准识别哪些 Identifier 是可安全重命名的局部变量或参数。
怎么用 @babel/parser + @babel/traverse 安全提取可混淆标识符
核心不是“找到所有变量”,而是“确认它是声明绑定且不暴露给外部”。比如 function apiCall(url, timeout) 中的 url 和 timeout 可混淆;但 obj.url 中的 url 是字面量属性名,不能动。
- 必须显式指定
sourceType: 'module',否则import语句解析失败,导致后续作用域链断裂 - 只处理以下节点的
Identifier子节点:VariableDeclarator.id、FunctionDeclaration.id、ArrowFunctionExpression.params、CatchClause.param - 跳过
MemberExpression.property(如res.data中的data)、ObjectProperty.key(如{ name: 'x' }中的name),它们不是绑定标识符 - 对每个
Identifier调用path.scope.getBinding(node.name),检查binding.kind是否为'var'/'let'/'const'/'param'—— 仅这些才允许替换
为什么 scope.hasBinding() 不够用,必须用 getBinding()
scope.hasBinding('x') 只返回布尔值,无法区分“函数参数 x”和“对象属性 obj.x”,两者都返回 false。而混淆工具必须拒绝后者,否则 obj.x 变成 obj._a 就彻底断掉逻辑。
scope.getBinding('x')返回完整绑定对象,含kind、path(声明位置)、referencePaths(所有引用点)- 在
function f(x) { let x = 2; }中,两个x的getBinding()结果不同:前者kind === 'param',后者kind === 'let',需分别处理 - 若只依赖
hasBinding(),函数参数会被漏掉——因为参数绑定在进入函数时才建立,hasBinding()在外层作用域查不到
如何避免混淆后破坏业务关键字段和调试线索
团队常有硬性要求:禁止混淆 __DEV__、API_BASE_URL、userId 等字段名,也不能动 console、localStorage 这类全局访问。AST 层面必须靠语义判断,不能靠字符串匹配。
- 在
Identifier访问时,先检查node.name是否在预设白名单中(如['console', 'localStorage', '__DEV__', 'API_BASE_URL']),命中则跳过 - 检查父节点类型:若
path.parentPath.isMemberExpression()且path.parent.property === node,说明是属性访问,直接 return - 检查是否属于导入绑定:
path.scope.getBinding(node.name)?.kind === 'module',这种是import { foo } from './x'的本地名,不能混淆(否则导出名丢失) - 对
ExportNamedDeclaration中的specifiers节点,完全跳过其local标识符——混淆它会导致模块使用者无法按名导入
混淆名生成必须隔离作用域,否则跨文件同名变量会撞车
用全局计数器生成 _a、_b 看似简单,但 a.js 和 b.js 都有 let count = 0,混淆后全变 let _a = 0,合并打包时就冲突了。
- 为每个
Scope实例维护独立的nameMap: Map,键为原始名,值为混淆后名 - 生成新名时加作用域指纹,例如
`_a${scope.path.node.loc?.start.line || 0}`,确保父子作用域、不同文件互不干扰 - 必须调用
path.replaceWith(t.identifier(newName)),而非直接改node.name—— 否则@babel/traverse不会更新引用路径映射,后续binding.referencePaths仍指向旧名,导致漏替换 - 混淆完成后,务必用
@babel/generator生成代码,并传入sourceMaps: true和原始sourceFileName,否则报错堆栈无法定位到源码行
真正难的不是替换名字,而是判断“这个 Identifier 到底算不算业务上下文里该保留的语义锚点”。比如 user.id 里的 id 不能动,但 const id = user.id 里的 id 可以动——二者在 AST 上是完全不同的节点类型和作用域关系,差之毫厘,运行即崩。
今天关于《如何通过静态分析 AST 手动编写一个针对特定业务逻辑的代码脱敏混淆工具》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!
-
502 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
334 收藏
-
163 收藏
-
445 收藏
-
254 收藏
-
416 收藏
-
127 收藏
-
386 收藏
-
474 收藏
-
260 收藏
-
437 收藏
-
343 收藏
-
343 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习