-
冷启动慢主因是import开销大,而非代码执行慢;Python启动时需逐行执行import,触发模块查找、源码读取、语法解析、字节码编译及模块级初始化,且容器/Serverless中无法复用缓存。
-
ZoneInfo是Python3.9+推荐的原生时区解决方案,直接对接IANAtzdata,可直接作为tzinfo参数传入datetime构造函数,无需localize;但Windows需额外安装tzdata包,且不支持模糊时区名。
-
推荐TTS用pyttsx3(离线轻量)或gTTS(需网、多语言),高自然度选CoquiTTS;ASR离线首选Whisper.cpp或Vosk,在线可用云API。
-
Python处理JSON嵌套结构需理解dict/list组合逻辑,通过json.loads()解析后,用get()安全访问、递归搜索提取字段,或setdefault/deepcopy稳妥修改。
-
zip()函数可将多个可迭代对象按索引聚合为元组迭代器,常用于并行迭代、构建字典、矩阵转置等场景;其以最短序列为准进行截断式合并,支持列表、元组、字符串、range等可迭代类型,结合itertools.zip_longest可实现填充式对齐。
-
使用glob、os.walk和pathlib可批量处理文件。1.glob通过通配符快速匹配如*.txt文件;2.os.walk遍历目录并用endswith筛选;3.pathlib提供面向对象的现代路径操作;按场景选择方法,结合异常处理,高效实现文件批量操作。
-
np.eye生成OneHot矩阵要求标签为从0开始的连续整数,否则需先标准化索引;字符串或非连续整数标签须用np.unique(...,return_inverse=True)转换;注意dtype、shape及内存效率问题。
-
Django读写分离需自定义DatabaseRouter类并注册到DATABASE_ROUTERS,db_for_read须判断事务避免不一致,db_for_write必须返回主库;select_related跨库JOIN会失效,应改用prefetch_related或统一模型库;ConnectionDoesNotExist需检查路由返回值与DATABASES键名是否精确匹配;强一致性读应主动using='default'而非依赖重试。
-
RuntimeError是Python中表示运行时未分类错误的异常,常由修改遍历中的容器、异步误用或线程违规操作引发,需通过副本遍历、正确使用async/await及队列通信等方式避免。
-
TypeGuard仅在静态类型检查阶段生效,不干预运行时行为;它不抛异常、不跳过分支、不校验数据合法性,仅向类型检查器提供类型收窄依据,故不能替代isinstance或运行时校验。
-
Hypercorn必须显式配置TLS证书和--http2参数才启用HTTP/2,纯HTTP请求强制降级为HTTP/1.1;缺一不可,否则即使配置TLS也仅运行HTTP/1.1。
-
pandas.read_csv()直接读大文件内存爆掉是常态,因默认全量加载+自动类型推断,2GBCSV内存占用可达6–8GB;含字符串列时更甚,且列名空格会导致字段引用错误。
-
先验证numpy是否真正安装成功,再检查其是否链接正确的OpenBLAS;若失败,优先用--only-binary安装预编译wheel;PyTorch场景下需按官方要求锁定numpy版本。
-
asyncio单元测试常卡住或超时,根本原因是测试与被测协程共用事件循环且存在未关闭的全局loop、阻塞调用或未await的后台任务;需用@pytest.mark.asyncio、禁用真实I/O、检查遗漏await。
-
df.drop(columns=['col'])默认返回新DataFrame而不修改原对象,需赋值或加inplace=True才生效;链式调用禁用inplace=True;Pandas2.0+正弱化inplace支持。