登录
首页 >  文章 >  php教程

PHP读取Excel文件的实用方法

时间:2026-03-11 12:45:45 482浏览 收藏

本文深入解析了在PHP中安全、高效读取Excel文件的实战方案,明确指出已弃用的PHPExcel存在严重兼容性与内存问题,强烈推荐唯一稳定可靠的现代替代方案——PhpSpreadsheet;文章覆盖从Composer安装、PHP版本要求(7.4+)、大文件内存优化(setReadDataOnly(true))、日期与数字类型精准处理、中文乱码根源排查,到上传文件路径安全验证及业务层数据校验等全链路关键细节,直击开发者日常踩坑痛点,帮你避开90%的Excel解析陷阱。

PHP怎么读取Excel文件_PHP导入Excel数据处理教程【教程】

PhpSpreadsheet 读取 Excel 最稳,别碰 PHPExcel

PHP 官方已弃用 PHPExcel,它不维护、不兼容 PHP 8+,且内存泄漏严重。现在唯一靠谱的选择是它的继任者 PhpSpreadsheet —— 它是纯 PHP 实现、支持 .xlsx.xls(需额外扩展)、能处理公式和样式。

安装方式:composer require phpoffice/phpspreadsheet。注意:不要手动下载 ZIP 或用老旧的 require_once 引入一堆文件,Composer 自动加载才是正解。

  • 如果项目还在用 PHP 7.2 以下,PhpSpreadsheet 会报错 —— 它最低要求 PHP 7.4
  • .xls(Excel 97–2003)默认不支持,需额外装 phpoffice/phpspreadsheet 的依赖 markbaker/complexmarkbaker/matrix,但更建议让前端统一导出 .xlsx
  • 大文件(>5MB)直接 load() 容易 OOM,得用 IOFactory::load() + setReadDataOnly(true) 跳过样式和公式

读取时卡死或内存爆掉?关掉样式和公式解析

默认行为是把字体、边框、公式结果全读进内存,一个 10MB 的表格可能吃掉 500MB 内存。真实业务里,90% 场景只需要数值。

正确做法是在加载前设置只读数据:

use PhpOffice\PhpSpreadsheet\IOFactory;

$reader = IOFactory::createReader('Xlsx');
$reader->setReadDataOnly(true); // 关键!
$spreadsheet = $reader->load('data.xlsx');
  • setReadDataOnly(true) 不影响数字、字符串、日期值,但跳过所有单元格样式、合并单元格信息、公式本身(只读计算结果)
  • 如果要读日期,记得调用 $cell->getFormattedValue(),否则返回 Excel 底层序列号(如 44562),不是 2022-01-01
  • $spreadsheet->getActiveSheet()->toArray() 一次性转数组最方便,但整表加载仍占内存;逐行遍历可用 getRowIterator() + getCellIterator() 流式处理

中文乱码、空值识别错、数字变科学计数?检查单元格类型和编码

Excel 里看似“文本”的单元格,PHP 可能识别成 numeric 类型;而中文列名或内容乱码,通常不是编码问题(Excel 本身是 UTF-16),而是 PHP 输出或数据库写入环节没设好字符集。

  • 读取前加 mb_internal_encoding('UTF-8') 没用 —— PhpSpreadsheet 内部已处理 Unicode,乱码大概率出在你 echo 到浏览器或插入 MySQL 时
  • 空单元格默认返回 null,但有些模板会填入空字符串 '' 或空白符,建议用 trim((string)$cell->getValue()) === '' 统一判空
  • 数字被转成科学计数法(如 1.23456789E+12),是因为 PHP 自动转了 float。解决方法:对数字列,用 $cell->getDataType() === \PhpOffice\PhpSpreadsheet\Cell\DataType::TYPE_NUMERIC 判断后,改用 $cell->getCalculatedValue() 或强制格式化为字符串

从上传临时文件读取失败?路径和权限比想象中敏感

$_FILES['file']['tmp_name'] 是临时路径,PhpSpreadsheet 能直接读,但常见错误是路径拼错、扩展名硬编码、或没检查上传是否成功。

  • 别写死 load('upload.xlsx'),必须用 $_FILES['file']['tmp_name'],且先确认 $_FILES['file']['error'] === UPLOAD_ERR_OK
  • 扩展名不能只看 $_FILES['file']['name'] 后缀,用户可伪造。应配合 finfo_open(FILEINFO_MIME_TYPE) 验证 MIME 类型是否为 application/vnd.openxmlformats-officedocument.spreadsheetml.sheet(xlsx)或 application/vnd.ms-excel(xls)
  • Linux 下如果 Apache/Nginx 用户无权读临时目录(比如 /tmpnoexec 挂载),会报 Could not open ... for reading! —— 此时需改用 move_uploaded_file() 先移到可读目录再 load

Excel 解析真正的复杂点不在读,而在“怎么定义哪列是手机号、哪列允许为空、怎么把身份证号当字符串而非数字”。这些规则没法靠库自动猜,得自己写校验逻辑,而且越晚做越难补救。

以上就是《PHP读取Excel文件的实用方法》的详细内容,更多关于的资料请关注golang学习网公众号!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>