首页 > 文章 > python教程

Python文件指针seek与tell使用技巧

时间：2026-01-28 22:36:56 437浏览收藏

“纵有疾风来，人生不言弃”，这句话送给正在学习文章的朋友们，也希望在阅读本文《Python 文件指针 seek 与 tell 边界详解》后，能够真的帮助到大家。我也会在后续的文章中，陆续更新文章相关的技术文章，有好的建议欢迎大家在评论留言，非常感谢！

Python文本模式下seek()仅允许seek(0)或seek(f.tell())，因需处理换行符转换、Unicode多字节编码等；二进制模式才支持任意字节偏移定位，tell()返回真实字节位置。

Python 文件指针 seek / tell 的边界问题

Python 中 seek() 和 tell() 在文本模式下行为受限，尤其在换行符、Unicode 编码和跨平台场景中容易出错；真正可自由定位的只有二进制模式。

文本模式下 seek() 只允许回到 tell() 返回的位置或文件开头

在以 'r'、'w+' 等文本模式打开文件时，seek() 的偏移量必须是之前 tell() 返回的值，或 0（即 seek(0)）。其他任意整数（比如 seek(5)）会触发 io.UnsupportedOperation: can't do nonzero end-relative seeks 或类似错误。

这是因为文本模式要处理换行符标准化（\r\n → \n）、字符编码（如 UTF-8 多字节字符）、以及缓冲区对齐等问题，Python 无法保证中间某个字节偏移对应合法的字符边界。

✅ 允许：f.seek(0)、f.seek(f.tell())
❌ 禁止：f.seek(10)、f.seek(-5, 2)（除非刚调用过 tell()）

二进制模式才是 seek/tell 的“完全体”

用 'rb'、'wb+' 打开文件后，seek() 支持任意合法偏移（包括负值、相对末尾等），tell() 返回的是真实的字节位置，无编码干扰。

例如读取 UTF-8 文件某一段：先用二进制模式定位，再按需解码局部字节：

with open('data.txt', 'rb') as f:
    f.seek(100)           # 跳到第 100 字节
    chunk = f.read(50)    # 读 50 字节
    text = chunk.decode('utf-8', errors='ignore')  # 容错解码

注意：直接对非字符边界截断可能导致解码失败（如截断一个多字节 UTF-8 字符），需配合 errors= 参数或手动校准。

tell() 的返回值在不同模式下含义不同

tell() 总是返回一个整数，但语义取决于打开模式：

文本模式：tell() 返回的是“不透明标记”，仅可用于后续 seek() 回退，不可解释为字节数或字符数；
二进制模式：tell() 返回当前文件指针的字节偏移量，可参与计算、保存、比较；
追加模式（'a' 或 'ab'）下，即使调用 seek()，写操作仍强制发生在文件末尾（POSIX 行为），tell() 可能显示中间位置，但 write() 不会覆盖。

跨平台换行符会让文本模式 seek 更难预测

Windows 默认用 \r\n，Unix 用 \n。文本模式下，Python 会把所有 \r\n 当作单个 \n 处理，但底层存储仍是两个字节。这就导致：

tell() 返回的“位置”不等于实际字节数；
同一段文本，在 Windows 和 Linux 上用文本模式 tell() 可能得到不同数值；
想精确定位某行某列？必须用二进制模式 + 自行解析换行符和编码。

例如统计第 3 行起始字节位置：逐行读二进制流并累加 len(line)（含原始换行符），比依赖文本模式 seek() 可靠得多。

终于介绍完啦！小伙伴们，这篇关于《Python文件指针seek与tell使用技巧》的介绍应该让你收获多多了吧！欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布文章相关知识，快来关注吧！