python教程技术文章-Golang学习网

文章 · python教程 | 3星期前 |

multiprocessing子进程不继承主线程全局变量修改，因其通过fork或spawn新建独立内存空间；Pool的maxtasksperchild用于定期重启worker防内存泄漏；Queue传大对象慢因序列化开销大，应优先用shared_memory；Windows下不加ifname=="__main__":会导致子进程重复执行顶层代码而崩溃。

221 收藏

文章 · python教程 | 3星期前 |

Pandas生产环境优化技巧分享

生产环境处理GB级CSV/Excel文件应使用chunksize分块读取，显式指定dtype和parse_dates优化内存与IO，避免链式赋值和iterrows，改用.loc、.str、.dt及query等向量化操作，并及时释放中间变量。

293 收藏

文章 · python教程 | 3星期前 |

Python文本清洗实战技巧分享

文本数据清洗需系统处理伪空值、编码异常、格式不一及非结构信息提取：先strip+replace统一空值，用utf-8-sig读取去BOM，正则清理控制字符，translate归一标点，小写/空格/数字标准化，正则或dateutil提取结构化字段。

205 收藏

文章 · python教程 | 3星期前 |

Python调试利器：trace模块追踪库调用链

本文介绍如何利用Python标准库中的trace模块，无需修改源码、不依赖外部工具，即可优雅地捕获任意函数（如tokenizer.tokenize()）执行过程中的完整调用栈、入参、返回值及逐行执行路径，大幅提升大型库的逆向分析与调试效率。

312 收藏

文章 · python教程 | 3星期前 |

Python路径拼接方法与跨平台处理技巧

应优先使用pathlib（Python3.4+）或os.path.join()拼接路径，避免手动拼接斜杠；pathlib自动处理分隔符、规范化和跨平台逻辑，如Path("data")/"raw"/"input.csv"。

113 收藏

文章 · python教程 | 3星期前 |

Pandas条件累积求和实现技巧

本文介绍如何在Pandas中高效构建依赖自身前一行值与另一列当前/前一行值的新列，核心是通过布尔分组+cumsum()实现“遇零重置”的滚动累加，避免显式循环或低效迭代。

305 收藏

文章 · python教程 | 3星期前 |

Python线程池使用教程与实例详解

答案是推荐使用concurrent.futures.ThreadPoolExecutor。Python标准库中无官方threadpool模块，常用的是concurrent.futures.ThreadPoolExecutor，支持submit提交任务和map批量处理，适用于I/O密集型任务，如网络请求，并发下载等，而第三方threadpool库已过时不推荐使用。

245 收藏

文章 · python教程 | 3星期前 |

Python 中的 contextmanager 是用于同步上下文管理的，但如果你希望它支持异步操作，可以使用 asynccontextmanager 装饰器。这个装饰器是 Python 3.7 引入的，专门用于定义异步上下文管理器。示例代码：from contextlib import asynccontextmanager @asynccontextmanager async def asy