登录
首页 >  文章 >  前端

手动编写 JS 关键字混淆重命名工具:AST 静态分析指南

时间:2026-05-21 12:54:32 466浏览 收藏

本文深入解析了如何利用 Babel 的 AST 静态分析能力,安全、精准地实现 JavaScript 关键字混淆重命名——避开直接遍历 Identifier 导致的 ReferenceError 陷阱,强调以作用域(scope)和绑定(binding)为核心,仅在声明位置生成唯一短名,并通过 scope.getBinding 自动映射所有引用;同时明确指出必须保留全局 API、导出变量等关键标识符,详述白名单机制与常见误混淆场景,并揭示手动重命名反而可能增大代码体积的真相:现代压缩器(如 Terser)已远超人工混淆的优化能力,真正高效的做法是清理无用节点后交由专业工具处理。

如何通过静态分析 AST(抽象语法树)手动编写一个简单的 JS 代码关键词混淆重命名工具

为什么直接遍历 Identifier 节点重命名会出错

很多人一上来就写个 Identifier 访问器,对所有 node.name 统一替换成随机字符串,结果跑完代码直接报错:ReferenceError: xxx is not defined。根本原因是没区分「声明」和「引用」——比如 function foo() {} 里的 foo 是声明,而 foo() 里的 foo 是引用,二者必须映射到同一个新名字;但 let bar = 1;function bar() {} 中的两个 bar 属于不同作用域,可以(也应该)重命名成不同值。

所以关键不是“找 Identifier”,而是“识别绑定(binding)+ 作用域链 + 引用关系”。Babel 的 @babel/traverse 内置了 scope 对象,能帮你自动追踪每个 Identifier 是声明还是引用、属于哪个作用域、是否被闭包捕获。

  • 只对 VariableDeclarator.idFunctionDeclaration.idClassDeclaration.idObjectProperty.key(当为标识符且非计算属性时)等**声明位置**的 Identifier 生成新名
  • 所有对应引用处(Identifier 节点)通过 scope.getBinding(node.name) 查绑定,再取其 identifier 替换
  • 跳过 JSXIdentifierImportSpecifier.localExportSpecifier.local 等非普通 JS 变量场景,否则破坏 JSX 或模块导出

如何用 @babel/traverse 安全收集并映射变量名

别自己手写作用域树。Babel traverse 在进入每个节点前已构建好完整作用域上下文,你只需在声明节点触发时调用 scope.generateUid() 获取唯一短名,并存入自定义映射表;后续所有引用都查这张表。

示例逻辑片段:

traverse(ast, {
  VariableDeclarator(path) {
    const { id, init } = path.node;
    if (id.type === 'Identifier') {
      // 仅处理顶层声明或函数内声明,跳过 for 循环中 let i 的 i(它会在 Scope 中自动注册)
      const binding = path.scope.getBinding(id.name);
      if (binding && !binding.constantViolations.length) {
        const newName = path.scope.generateUid(id.name);
        binding.identifier.name = newName;
        // 记录映射用于调试或白名单排除
        renameMap.set(id.name, newName);
      }
    }
  }
});
  • scope.generateUid() 比手动拼接更安全:自动避让已存在变量、保留原始首字母(可选)、支持前缀(如 scope.generateUid('a', { prefix: '_' })
  • 务必检查 binding.constantViolations:比如 const a = 1; a = 2; 会导致 violation,说明该 binding 不是纯声明,不应参与混淆
  • 不要在 Identifier 入口统一替换——那样会把字符串字面量里的 "foo" 也误替(虽然 AST 中它不是 Identifier,但容易混淆思路)

哪些名字必须保留不混淆?怎么加白名单

混淆不是越狠越好。以下名字一旦改掉,运行时立刻崩:

  • 全局对象属性:consoledocumentlocalStoragefetchJSONPromise 等浏览器/Node 内置 API
  • 用户显式导出的变量:export const utils = {...} 中的 utils,否则外部无法引用
  • eval()withFunction 构造函数动态访问的变量(极难静态分析,建议直接禁用这些语法)
  • 正则字面量中的捕获组名(/(?\w+)/)——AST 中它是 RegExpLiteral,不走 Identifier 流程,但名字语义敏感

实现白名单最轻量方式:维护一个 Set,在每次准备重命名前先查 if (reservedNames.has(oldName)) return;。Babel 插件里可这样初始化:

const reservedNames = new Set([
  'console', 'document', 'window', 'globalThis',
  'localStorage', 'sessionStorage', 'navigator',
  'setTimeout', 'setInterval', 'fetch', 'XMLHttpRequest'
]);

注意:ESLint 的 eslint-plugin-no-undef 规则所依赖的 global list(如 es2021 preset)可直接复用,避免漏判。

混淆后为什么代码体积没变小?甚至更大了

单纯用 abc 替换长名看似省字节,但实际常导致体积增加——因为现代压缩器(Terser)本身就能做更优的重命名:它知道哪些变量可压缩成单字母、哪些因跨作用域必须保留长度、哪些可复用同一缩写。你手动混淆反而干扰了 Terser 的优化路径。

  • 例如你把 componentDidMount 改成 _a,Terser 原本可能把它压缩成 c 并复用给其他变量;现在它只能保留 _a,还多了一个下划线
  • Babel 输出默认带空格和换行,未启用 minified: true 选项时,AST 生成代码比原文件还冗余
  • 真正有效的混淆是删除 AST 中的 CommentDebuggerStatement、冗余 ReturnStatement,再交由 Terser 处理,而非抢它饭碗

如果你真要减体积,优先做:关闭 Babel 的 sourceMaps、设置 compact: true、用 TerserPlugin 替代手动混淆——后者才是生产环境事实标准。

今天带大家了解了的相关知识,希望对你有所帮助;关于文章的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    立即学习 543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    立即学习 516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    立即学习 500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    立即学习 487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    立即学习 485次学习