手动编写 JS 关键字混淆重命名工具:AST 静态分析指南
时间:2026-05-21 12:54:32 466浏览 收藏
本文深入解析了如何利用 Babel 的 AST 静态分析能力,安全、精准地实现 JavaScript 关键字混淆重命名——避开直接遍历 Identifier 导致的 ReferenceError 陷阱,强调以作用域(scope)和绑定(binding)为核心,仅在声明位置生成唯一短名,并通过 scope.getBinding 自动映射所有引用;同时明确指出必须保留全局 API、导出变量等关键标识符,详述白名单机制与常见误混淆场景,并揭示手动重命名反而可能增大代码体积的真相:现代压缩器(如 Terser)已远超人工混淆的优化能力,真正高效的做法是清理无用节点后交由专业工具处理。

为什么直接遍历 Identifier 节点重命名会出错
很多人一上来就写个 Identifier 访问器,对所有 node.name 统一替换成随机字符串,结果跑完代码直接报错:ReferenceError: xxx is not defined。根本原因是没区分「声明」和「引用」——比如 function foo() {} 里的 foo 是声明,而 foo() 里的 foo 是引用,二者必须映射到同一个新名字;但 let bar = 1; 和 function bar() {} 中的两个 bar 属于不同作用域,可以(也应该)重命名成不同值。
所以关键不是“找 Identifier”,而是“识别绑定(binding)+ 作用域链 + 引用关系”。Babel 的 @babel/traverse 内置了 scope 对象,能帮你自动追踪每个 Identifier 是声明还是引用、属于哪个作用域、是否被闭包捕获。
- 只对
VariableDeclarator.id、FunctionDeclaration.id、ClassDeclaration.id、ObjectProperty.key(当为标识符且非计算属性时)等**声明位置**的Identifier生成新名 - 所有对应引用处(
Identifier节点)通过scope.getBinding(node.name)查绑定,再取其identifier替换 - 跳过
JSXIdentifier、ImportSpecifier.local、ExportSpecifier.local等非普通 JS 变量场景,否则破坏 JSX 或模块导出
如何用 @babel/traverse 安全收集并映射变量名
别自己手写作用域树。Babel traverse 在进入每个节点前已构建好完整作用域上下文,你只需在声明节点触发时调用 scope.generateUid() 获取唯一短名,并存入自定义映射表;后续所有引用都查这张表。
示例逻辑片段:
traverse(ast, {
VariableDeclarator(path) {
const { id, init } = path.node;
if (id.type === 'Identifier') {
// 仅处理顶层声明或函数内声明,跳过 for 循环中 let i 的 i(它会在 Scope 中自动注册)
const binding = path.scope.getBinding(id.name);
if (binding && !binding.constantViolations.length) {
const newName = path.scope.generateUid(id.name);
binding.identifier.name = newName;
// 记录映射用于调试或白名单排除
renameMap.set(id.name, newName);
}
}
}
});
scope.generateUid()比手动拼接更安全:自动避让已存在变量、保留原始首字母(可选)、支持前缀(如scope.generateUid('a', { prefix: '_' }))- 务必检查
binding.constantViolations:比如const a = 1; a = 2;会导致 violation,说明该 binding 不是纯声明,不应参与混淆 - 不要在
Identifier入口统一替换——那样会把字符串字面量里的"foo"也误替(虽然 AST 中它不是 Identifier,但容易混淆思路)
哪些名字必须保留不混淆?怎么加白名单
混淆不是越狠越好。以下名字一旦改掉,运行时立刻崩:
- 全局对象属性:
console、document、localStorage、fetch、JSON、Promise等浏览器/Node 内置 API - 用户显式导出的变量:
export const utils = {...}中的utils,否则外部无法引用 - 被
eval()、with、Function构造函数动态访问的变量(极难静态分析,建议直接禁用这些语法) - 正则字面量中的捕获组名(
/(?)——AST 中它是\w+)/ RegExpLiteral,不走 Identifier 流程,但名字语义敏感
实现白名单最轻量方式:维护一个 Set,在每次准备重命名前先查 if (reservedNames.has(oldName)) return;。Babel 插件里可这样初始化:
const reservedNames = new Set([ 'console', 'document', 'window', 'globalThis', 'localStorage', 'sessionStorage', 'navigator', 'setTimeout', 'setInterval', 'fetch', 'XMLHttpRequest' ]);
注意:ESLint 的 eslint-plugin-no-undef 规则所依赖的 global list(如 es2021 preset)可直接复用,避免漏判。
混淆后为什么代码体积没变小?甚至更大了
单纯用 a、b、c 替换长名看似省字节,但实际常导致体积增加——因为现代压缩器(Terser)本身就能做更优的重命名:它知道哪些变量可压缩成单字母、哪些因跨作用域必须保留长度、哪些可复用同一缩写。你手动混淆反而干扰了 Terser 的优化路径。
- 例如你把
componentDidMount改成_a,Terser 原本可能把它压缩成c并复用给其他变量;现在它只能保留_a,还多了一个下划线 - Babel 输出默认带空格和换行,未启用
minified: true选项时,AST 生成代码比原文件还冗余 - 真正有效的混淆是删除 AST 中的
Comment、DebuggerStatement、冗余ReturnStatement,再交由 Terser 处理,而非抢它饭碗
如果你真要减体积,优先做:关闭 Babel 的 sourceMaps、设置 compact: true、用 TerserPlugin 替代手动混淆——后者才是生产环境事实标准。
今天带大家了解了的相关知识,希望对你有所帮助;关于文章的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~
-
502 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
448 收藏
-
259 收藏
-
353 收藏
-
314 收藏
-
304 收藏
-
191 收藏
-
473 收藏
-
199 收藏
-
169 收藏
-
225 收藏
-
150 收藏
-
104 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习