Python去除字符串空格的全面方法
时间:2026-01-11 16:50:52 197浏览 收藏
哈喽!今天心血来潮给大家带来了《Python消除字符串空格的完整方法》,想必大家应该对文章都不陌生吧,那么阅读本文就都不会很困难,以下内容主要涉及到,若是你正在学习文章,千万别错过这篇文章~希望能帮助到你!
Python字符串去空格需按场景选择方法:strip()等仅处理首尾ASCII空白;全角空格需显式传参;replace()/translate()适合批量删特定字符;正则re.sub()最灵活,可处理逻辑空格及不可见字符。

Python 里消除字符串空格不是只有一个 strip() 就完事的——它根本不能去掉中间的空格,而你真正需要的,往往取决于空格出现在哪、要不要保留换行、是否要统一多个空格为一个,甚至是否要兼容全角空格。
用 strip()、lstrip()、rstrip() 去掉首尾空白(但仅限 ASCII 空白)
这三个方法只影响字符串开头和/或结尾,且默认只识别 ' '、'\t'、'\n'、'\r'、'\f'、'\v' 这六种字符。它们对中文全角空格 、不间断空格 (U+00A0)、零宽空格等完全无效。
常见错误现象:用 s.strip() 处理从网页或 Excel 里读出的字符串,结果首尾看着“空”却去不掉——大概率是全角空格或零宽字符。
- 只去左边:用
s.lstrip() - 只去右边:用
s.rstrip() - 想同时去掉首尾的全角空格?得显式传参:
s.strip(' \t\n\r\xA0\u3000')(其中\u3000是中文全角空格) - 注意:传入的字符串是“字符集合”,不是正则;重复字符自动去重,顺序无关
用 replace() 或 translate() 批量删特定空格字符
当你明确知道要干掉哪几种空格(比如所有制表符、所有全角空格),replace() 最直观;但若要一次替换多种字符,translate() 效率更高,尤其处理长文本时。
使用场景:清洗爬虫返回的 HTML 文本、处理用户粘贴进来的富文本、标准化日志字段。
s.replace(' ', '').replace('\t', '').replace('\u3000', '')—— 简单直接,适合少量字符- 更高效写法:
s.translate(str.maketrans('', '', ' \t\n\r\xA0\u3000'))第三个参数是“要删除的字符集” translate()不支持正则,也不能替换成别的字符(那是str.translate(table)的用法)
用正则 re.sub() 处理“逻辑空格”:合并中间空格、删所有空白、保留换行等
真正灵活的空格控制,必须靠正则。比如“把连续多个空白(含换行)缩成一个空格”,或者“只删空格和制表符,但保留换行”,strip() 和 replace() 都做不到。
性能影响:短字符串几乎无感;但循环中高频调用 re.sub(r'\s+', ' ', s) 可能成为瓶颈,建议预编译正则对象。
- 删所有空白字符(含换行、制表、全角空格):
re.sub(r'\s+', '', s) - 把中间多个空白(不含首尾)压成单个空格,首尾空白照常删:
re.sub(r'\s+', ' ', s).strip() - 只删 ASCII 空格和制表符,保留换行和全角空格:
re.sub(r'[ \t]+', '', s) - 安全起见,加
re.UNICODE标志以确保匹配 Unicode 空白(如\u3000):re.sub(r'\s+', ' ', s, flags=re.UNICODE)
注意不可见字符:零宽空格、BOM、软连字符等真会破坏逻辑
很多“看起来没空格却匹配失败”的问题,根源是零宽空格 \u200B、字节顺序标记 BOM \ufeff、软连字符 \u00AD。它们不显示,但参与字符串比较、正则匹配、JSON 解析,甚至导致 == 判断为 False。
容易被忽略的地方:从 Word、微信、某些 CMS 复制的文本,或 UTF-8 with BOM 编码的文件,极易带入这类字符。
- 快速检测:
[c for c in s if ord(c) 可揪出低码值控制字符 - 一并清理常见干扰符:
s.translate(str.maketrans('', '', '\u200B\u200C\u200D\uFEFF\u00AD')) - 读文件时加
encoding='utf-8-sig'自动剥离 BOM,比手动 strip 更可靠
到这里,我们也就讲完了《Python去除字符串空格的全面方法》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于的知识点!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
473 收藏
-
136 收藏
-
113 收藏
-
361 收藏
-
229 收藏
-
113 收藏
-
147 收藏
-
496 收藏
-
410 收藏
-
297 收藏
-
271 收藏
-
317 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习