登录
首页 >  文章 >  python教程

Python文件指针seek与tell使用技巧

时间:2026-01-28 22:36:56 437浏览 收藏

“纵有疾风来,人生不言弃”,这句话送给正在学习文章的朋友们,也希望在阅读本文《Python 文件指针 seek 与 tell 边界详解》后,能够真的帮助到大家。我也会在后续的文章中,陆续更新文章相关的技术文章,有好的建议欢迎大家在评论留言,非常感谢!

Python文本模式下seek()仅允许seek(0)或seek(f.tell()),因需处理换行符转换、Unicode多字节编码等;二进制模式才支持任意字节偏移定位,tell()返回真实字节位置。

Python 文件指针 seek / tell 的边界问题

Python 中 seek()tell() 在文本模式下行为受限,尤其在换行符、Unicode 编码和跨平台场景中容易出错;真正可自由定位的只有二进制模式。

文本模式下 seek() 只允许回到 tell() 返回的位置或文件开头

在以 'r''w+' 等文本模式打开文件时,seek() 的偏移量必须是之前 tell() 返回的值,或 0(即 seek(0))。其他任意整数(比如 seek(5))会触发 io.UnsupportedOperation: can't do nonzero end-relative seeks 或类似错误。

这是因为文本模式要处理换行符标准化(\r\n\n)、字符编码(如 UTF-8 多字节字符)、以及缓冲区对齐等问题,Python 无法保证中间某个字节偏移对应合法的字符边界。

  • ✅ 允许:f.seek(0)f.seek(f.tell())
  • ❌ 禁止:f.seek(10)f.seek(-5, 2)(除非刚调用过 tell()

二进制模式才是 seek/tell 的“完全体”

'rb''wb+' 打开文件后,seek() 支持任意合法偏移(包括负值、相对末尾等),tell() 返回的是真实的字节位置,无编码干扰。

例如读取 UTF-8 文件某一段:先用二进制模式定位,再按需解码局部字节:

with open('data.txt', 'rb') as f:
    f.seek(100)           # 跳到第 100 字节
    chunk = f.read(50)    # 读 50 字节
    text = chunk.decode('utf-8', errors='ignore')  # 容错解码

注意:直接对非字符边界截断可能导致解码失败(如截断一个多字节 UTF-8 字符),需配合 errors= 参数或手动校准。

tell() 的返回值在不同模式下含义不同

tell() 总是返回一个整数,但语义取决于打开模式:

  • 文本模式:tell() 返回的是“不透明标记”,仅可用于后续 seek() 回退,不可解释为字节数或字符数;
  • 二进制模式:tell() 返回当前文件指针的字节偏移量,可参与计算、保存、比较;
  • 追加模式('a''ab')下,即使调用 seek(),写操作仍强制发生在文件末尾(POSIX 行为),tell() 可能显示中间位置,但 write() 不会覆盖。

跨平台换行符会让文本模式 seek 更难预测

Windows 默认用 \r\n,Unix 用 \n。文本模式下,Python 会把所有 \r\n 当作单个 \n 处理,但底层存储仍是两个字节。这就导致:

  • tell() 返回的“位置”不等于实际字节数;
  • 同一段文本,在 Windows 和 Linux 上用文本模式 tell() 可能得到不同数值;
  • 想精确定位某行某列?必须用二进制模式 + 自行解析换行符和编码。

例如统计第 3 行起始字节位置:逐行读二进制流并累加 len(line)(含原始换行符),比依赖文本模式 seek() 可靠得多。

终于介绍完啦!小伙伴们,这篇关于《Python文件指针seek与tell使用技巧》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布文章相关知识,快来关注吧!

前往漫画官网入口并下载 ➜
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>