python教程技术文章
-
元组是不可变序列,用()创建,支持索引切片,提供count和index方法,可进行拼接、重复、解包等操作,适用于存储不变数据。494 收藏 -
该错误是运行时对None进行下标操作所致,因sort()等就地方法、漏写return或API失败导致返回None;需先判空再类型校验,如isinstance(items,(list,tuple))anditems。494 收藏 -
连接Python和Spark的关键在于安装PySpark并正确配置环境。首先,使用pipinstallpyspark安装PySpark;其次,通过创建SparkSession设置应用名称、运行模式及配置参数;第三,若需连接远程集群,需确保版本一致、配置文件齐全并设置SPARK_HOME;最后,注意Python版本匹配、网络权限、依赖管理和日志排查等常见问题。494 收藏 -
torch.export不能直接导出ONNX,需先用torch.export得到ExportedProgram,再通过torch.onnx.dynamo_export或第三方工具转为ONNX;要求模型可追踪、无副作用、输入仅为Tensor/tuple/dict、动态尺寸需显式声明。493 收藏 -
安装Python扩展模块需使用pip命令,如pipinstall模块名,推荐结合虚拟环境隔离依赖,避免版本冲突。493 收藏 -
pytest中跨用例传参应使用config.cache而非全局变量,因其线程安全、兼容多进程、支持session级生命周期;推荐封装为session-scopedfixture统一管理key前缀与读写逻辑。493 收藏 -
asyncio.TaskGroup是用于结构化并发的强制性边界,防止任务泄露、确保异常不静默、统一管理子任务生命周期;必须用asyncwith进入,自动等待或取消全部子任务,不可手动实例化或外泄引用。493 收藏 -
ctypes.Structure本质是为C交互服务,非通用数据容器;仅在调用DLL、解析二进制协议等需精确内存布局时必要,必须用ctypes类型、注意对齐填充、不可动态增删字段。493 收藏 -
AQE默认开启后JOIN变慢,因小数据量或非均匀分区下,运行时统计缺失导致误判重分区与策略优化,反而增加调度开销和延迟。492 收藏 -
Python字符串比较用==、!=等运算符,按Unicode码点逐字符比对,区分大小写且严格字典序;"hello"=="Hello"为False,"test"=="test"为False,"123"==123为False。492 收藏 -
正则性能瓶颈常源于回溯爆炸,即re模块因嵌套量词、重叠可选结构等导致指数级匹配尝试;优化需用原子组、占有量词、锚点及预筛选降低歧义与回溯开销。492 收藏 -
IsolationForest比Z-Score更适合高维数据,因其不依赖分布假设、无需协方差矩阵,通过随机分割孤立异常点,对特征相关性与量纲差异不敏感;Z-Score在维度>5时易失效。492 收藏 -
必须用global声明才能在函数内重新绑定全局变量,否则赋值会创建局部变量;读取全局变量无需声明,修改可变对象内容也不需global,仅重新赋值变量名时才需要。492 收藏 -
Python内置json模块支持JSON与Python对象双向转换,核心方法为loads/load(解析)和dumps/dump(生成),兼容常见类型,需注意编码、中文显示、日期处理及非标准类型限制。492 收藏 -
根本原因是系统缺少libxml2开发文件,Linux需装libxml2-dev,macOS用brew装并设环境变量,Windows应强制安装预编译wheel或改用condainstalllxml。492 收藏