-
zscore返回NaN需先检查并过滤NaN/inf,或用nan_policy='omit';阈值3不普适,应结合分布和业务调整;多维数据需区分字段级与样本级检测;pandas计算慢时优先用scipy.stats.zscore。
-
先检查nvidia-smitopo-p2pr输出是否大量显示N/A或PHB而非PIX/SYS,若P2P未通则all_reduce降速3–5倍;确认硬件拓扑、BIOS设置,禁用CUDA_VISIBLE_DEVICES并显式绑定设备,backend必须设为"nccl",再通过nvidia-smidmon-su-d1观察PCIe带宽是否饱和。
-
真正需解决的是工程化落地问题:setup.py与pyproject.toml选型、旧项目迁移字段修改、pipinstall-e.路径异常、poetryCI超时优化、entry_points键名错误等。
-
最稳的分卷压缩方案是调用7z命令,关键参数为-v(如-v50m),需带单位、用绝对路径、全小写文件名,Python中用subprocess传列表而非字符串,zipfile不支持原生分卷。
-
NumPy数组不能直接当字典键,因其可变且无hash值;tobytes()是最稳妥的转换方式,将数组内存布局序列化为不可变bytes,但需注意dtype、连续性及NaN等细节。
-
pytest需在单个测试函数内用threading.Thread启动多线程并发调用被测函数,通过共享可变对象、控制同步时机、捕获子线程异常并join等待,以复现确定性竞态问题。