登录
首页 >  文章 >  python教程

Python如何检测字符串中的不可打印字符

时间:2026-01-21 22:51:45 452浏览 收藏

一分耕耘,一分收获!既然打开了这篇文章《Python检测字符串含不可打印字符方法》,就坚持看下去吧!文中内容包含等等知识点...希望你能在阅读本文后,能真真实实学到知识或者帮你解决心中的疑惑,也欢迎大佬或者新人朋友们多留言评论,多给建议!谢谢!

最推荐用 str.isprintable() 判断字符串是否含不可打印字符,它返回 True 当且仅当非空且全为可打印字符;空字符串返回 False,控制符、零宽字符、组合符等均被识别为不可打印。

Python 如何检测字符串是否包含不可打印字符

Python 中判断字符串是否包含不可打印字符,最直接的方式是检查每个字符的 Unicode 类别或使用 str.isprintable() 方法——它专为此设计,且行为明确、性能好。

str.isprintable() 快速判断

这是最推荐的方法。该方法返回 True 当且仅当字符串非空且所有字符都是可打印的(不含控制字符、换行符、制表符等),空字符串也返回 False

  • "hello"True
  • "hello\n"False(含换行符)
  • "hello\t"False(含制表符)
  • ""False(空字符串不视为可打印)
  • "hello\x00world"False(含空字符)

定位具体不可打印字符(调试用)

若需知道哪些字符不可打印,可遍历字符串,结合 unicodedata.category() 或直接比对控制字符范围:

  • 控制字符的 Unicode 类别以 C 开头(如 Cc 控制符、Cf 格式符、Co 私有使用、Cn 未分配)
  • 常用做法:导入 unicodedata,对每个字符调用 unicodedata.category(c).startswith('C')
  • 简单替代:检查 ord(c) < 32 and c not in '\t\n\r'(粗略过滤 ASCII 控制符,但不覆盖 Unicode 全集)

注意边界情况

某些字符看似“空白”,实则不可打印,容易被忽略:

  • 零宽空格(\u200b)、零宽非连接符(\u200c)、左至右标记(\u200e)等 —— 它们属于 Cf 类,isprintable() 返回 False
  • 全角空格(\u3000)是可打印的(属于 Zs 分隔符),isprintable() 返回 True
  • 组合字符(如重音符号 \u0301)属于 Mn(标记-非间距),isprintable() 返回 False

实用检测函数示例

封装一个兼顾判断与提示的函数:

import unicodedata

def has_non_printable(s):
    if not isinstance(s, str):
        return False
    if not s:
        return False
    return not s.isprintable()

def find_non_printable_chars(s):
    return [
        (i, c, unicodedata.category(c), f'U+{ord(c):04X}')
        for i, c in enumerate(s)
        if unicodedata.category(c).startswith('C') or ord(c) == 0
    ]

今天带大家了解了的相关知识,希望对你有所帮助;关于文章的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

前往漫画官网入口并下载 ➜
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>