首页 > 文章 > 前端

codePointAt提取Unicode控制符方法解析

时间：2026-05-06 19:12:54 350浏览收藏

本文深入解析了如何利用 JavaScript 的 `codePointAt()` 方法准确识别和提取 Unicode 控制字符——它并非直接“提取隐藏符”的黑魔法，而是通过安全遍历（自动处理代理对）结合关键码点范围判断（涵盖 C0/C1 控制符、格式化符如 ZWSP/RLO、BOM 等共七大区间），实现对不可见功能字符的精准定位与标记；文末提供可直接运行的实战代码，帮你告别因错误遍历导致的乱码误判，在字符串清洗、安全审计或调试隐形问题时真正掌控每一个“看不见”的字符。

如何利用 String.prototype.codePointAt() 遍历原始文本并提取隐藏的 Unicode 控制符

codePointAt() 本身不用于“提取隐藏控制符”，而是获取指定位置的 Unicode 码点值；要识别控制符，需结合码点范围判断——关键在遍历 + 条件过滤。

理解哪些码点属于 Unicode 控制字符

Unicode 控制字符（C0/C1 控制符、格式化符、私用区以外的不可见功能符）主要分布在以下范围：

U+0000–U+001F（C0 控制符，如 \u0000 NUL、\u0009 TAB、\u000A LF）
U+007F（DEL）
U+0080–U+009F（C1 控制符，如 \u0085 NEL）
U+2000–U+200F、U+2028–U+202E、U+2060–U+206F（常用格式控制符，如 ZWSP \u200B、LRM \u200E、RLO \u202E）
U+FEFF（BOM，零宽无断空格，常被误用为隐藏标记）

用 codePointAt() 安全遍历所有码点（含代理对）

普通 for (let i = 0; i 会把代理对（surrogate pair）拆成两个错误码点；codePointAt(i) 自动处理代理对，且返回完整码点，但需配合 String.fromCodePoint() 和跳过后续代理高位：

调用 str.codePointAt(i) 获取当前位置码点
若返回值 ≥ 0x10000，说明是代理对，下一位（i+1）属于该字符，下次循环应跳过它（即 i++）
否则正常递增 i

提取并标记控制符的实际代码示例

以下函数返回所有控制符的位置、码点、名称（简略）和原始表示：

function findControlChars(str) {
  const controls = [];
  for (let i = 0; i = 0x10000) i++; 

    // 判断是否为常见控制/格式字符
    if (
      (cp >= 0x0000 && cp = 0x0080 && cp = 0x2000 && cp = 0x2028 && cp = 0x2060 && cp 

注意边界与实际用途
提取到的控制符未必“恶意”——它们可能合法存在于富文本、国际化排版或协议数据中。真正需警惕的是：

用户输入中意外混入的 \u202E（强制反转显示，用于视觉欺骗）
用 \u200B 拆分单词绕过关键词过滤
BOM 开头干扰 JSON 解析或脚本执行
非打印控制符导致正则匹配、长度计算、DOM 渲染异常

因此，检测后应根据场景选择：日志记录、清理（replace() 过滤）、转义显示，或拒绝输入。

理论要掌握，实操不能落！以上关于《codePointAt提取Unicode控制符方法解析》的详细介绍，大家都掌握了吧！如果想要继续提升自己的能力，那么就来关注golang学习网公众号吧！

最新阅读

更多>

文章 · 前端 | 3天前 | 前端 · 接口联调 · 表单交互 · 重复提交 · 用户体验 · 前端表单提交重复请求 AbortController 幂等键按钮禁用

前端表单重复提交防护工作流：从按钮状态到请求取消和幂等键

374 收藏
文章 · 前端 | 1星期前 | 前端 · cors · 跨域排查 · 浏览器网络 · 接口联调 · 前端 cors 请求头跨域预检请求 Options

前端 CORS 预检失败排查流程：从请求头到网关响应

422 收藏
文章 · 前端 | 1星期前 | 前端 · css · sticky · 布局排查 · 滚动容器 · CSS 前端 Overflow position sticky 滚动容器吸顶失效

前端 position sticky 不生效排查：从滚动容器到 overflow 限制

449 收藏
文章 · 前端 | 1星期前 | 前端 · 性能优化 · 图片加载 · 前端性能优化图片懒加载 IntersectionObserver LCP

前端图片懒加载实战：首屏 LCP 与滚动加载完整流程

105 收藏
文章 · 前端 | 1星期前 | 前端 · 性能优化 · 表单校验 · JavaScript 前端表单校验重复提交提交锁

前端表单联动校验失效排查：旧状态、重复提交和提交锁

285 收藏
文章 · 前端 | 1星期前 | 前端 · 性能优化 · 虚拟列表 · JavaScript 前端性能优化虚拟滚动长列表优化

前端长列表虚拟滚动实战：从可视区计算到滚动流畅

111 收藏
文章 · 前端 | 1星期前 | 定时器 · 前端 · 性能排查 · 接口请求 · 轮询 · setInterval · setInterval 页面可见性 clearInterval 前端轮询请求堆积定时器清理

前端轮询接口越打越多怎么办：从重复定时器到清理机制一步步排查

490 收藏
文章 · 前端 | 1星期前 | 前端 · 状态管理 · 表单提交 · 防重复提交 · 接口幂等 · 重复提交前端表单请求去重按钮锁定幂等key

前端表单重复提交治理完整流程：按钮锁定、请求去重和幂等 key

253 收藏
文章 · 前端 | 1星期前 | 前端 · 搜索框 · AbortController · 接口请求 · 状态管理 · Fetch AbortController 前端搜索请求乱序旧响应覆盖

前端搜索结果倒退怎么办：AbortController 取消旧请求和序号兜底

295 收藏
文章 · 前端 | 1星期前 | 前端 · 性能优化 · cls · 懒加载 · Core Web Vitals · 前端图片懒加载 IntersectionObserver CLS 布局稳定

前端图片懒加载布局抖动治理完整流程：占位比例、按需加载和 CLS 复查

128 收藏
文章 · 前端 | 1星期前 | 前端 · 消息队列 · websocket · 实时通信 · 断线重连 · 前端 websocket 心跳检测断线重连消息补发

前端 WebSocket 断线重连完整流程：心跳检测、退避重试和消息补发

365 收藏
文章 · 前端 | 1星期前 | 工程化 · 前端 · javascript · css · 弹窗 · 前端 z-index 遮罩层 stacking context Portal 弹窗层级

前端弹窗层级治理工作流：从 z-index 混乱到 Portal 容器规范

350 收藏

课程推荐

更多>

前端进阶之JavaScript设计模式

设计模式是开发人员在软件开发过程中面临一般问题时的解决方案，代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景，打造一站式知识长龙服务，适合有JS基础的同学学习。

立即学习 543次学习
GO语言核心编程课程

本课程采用真实案例，全面具体可落地，从理论到实践，一步一步将GO核心编程技术、编程思想、底层实现融会贯通，使学习者贴近时代脉搏，做IT互联网时代的弄潮儿。

立即学习 516次学习
简单聊聊mysql8与网络通信

如有问题加微信：Le-studyg；在课程中，我们将首先介绍MySQL8的新特性，包括性能优化、安全增强、新数据类型等，帮助学生快速熟悉MySQL8的最新功能。接着，我们将深入解析MySQL的网络通信机制，包括协议、连接管理、数据传输等，让

立即学习 500次学习
JavaScript正则表达式基础与实战

在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。

立即学习 487次学习
从零制作响应式网站—Grid布局

本系列教程将展示从零制作一个假想的网络科技公司官网，分为导航，轮播，关于我们，成功案例，服务流程，团队介绍，数据部分，公司动态，底部信息等内容区块。网站整体采用CSSGrid布局，支持响应式，有流畅过渡和展现动画。

立即学习 485次学习