python教程技术文章-Golang学习网

文章 · python教程 | 2星期前 |

PYTHONIOENCODING=utf-8仅影响sys.stdout/stderr初始化，对文件读写、网络传输、数据库、logging等无效；失效场景包括stdout被reconfigure覆盖、子进程不继承、Windows终端代码页未同步、IDE或Web框架重定向标准流。

330 收藏

文章 · python教程 | 2星期前 |

Scikit-learn如何划分训练集和测试集

train_test_split数据比例异常的根本原因是未设random_state或误将test_size当绝对数量用；它默认按比例切分，传整数才按条数切，但需确保数据量足够且行数一致，加stratify=y可保类别比例，shuffle=True防时序泄露，返回顺序固定为X_train、X_test、y_train、y_test，时间序列须用TimeSeriesSplit。

397 收藏

文章 · python教程 | 2星期前 |

Python向量化函数多次调用失效原因解析

本文解析为何selection_update_weights()函数首次调用生效、后续调用无更新——根本原因在于所有更新逻辑均依赖静态原始列（如predicted_score_difference），未引入状态累积或自引用更新，导致重复执行结果恒定。

228 收藏

文章 · python教程 | 2星期前 |

Python生成JUnit报告及Jenkins集成教程

Pytest本身不生成标准JUnitXML，但用--junitxml参数可以生成Jenkins可识别的近似格式——前提是别指望它100%兼容所有JUnit解析器，尤其涉及嵌套套件或自定义属性时。为什么--junitxml生成的文件Jenkins能认，但有时显示异常Pytest的--junitxml输出的是“JUnit风格”而非严格遵循JUnitDTD/XSD的XML。Jenkins的JUnit插件做了宽松解析，能容忍缺失testsuite@hos

103 收藏

文章 · python教程 | 2星期前 |

FlaskSQLAlchemy数据库读写分离配置教程

SQLAlchemy-Bind是Flask-SQLAlchemy的多数据库绑定机制，非独立包；它通过SQLALCHEMY_BINDS配置字典定义多个数据库连接，并由模型的__bind_key__显式指定归属，未声明者默认使用SQLALCHEMY_DATABASE_URI所指主库。

408 收藏

文章 · python教程 | 2星期前 |

pytest脱敏技巧：修改_runtest_logreport过滤敏感信息

pytest_runtest_logreport不适合脱敏，因为它仅接收已字符串化的report（如longrepr、capstdout），不接触原始参数、断言表达式或日志record对象；敏感信息在进入该hook前就已固化为不可逆文本，正则替换易漏误伤且无法覆盖动态值。

431 收藏

文章 · python教程 | 2星期前 |

Python随机抽取多个样本技巧

random.sample不能重复抽样因其设计为无放回抽样，内部打乱索引后取前k个；重复值源于原列表本身含重复元素，非函数问题。

458 收藏

文章 · python教程 | 2星期前 |

生成器表达式实现多层数据扁平化方法

本文详解生成器表达式在嵌套迭代场景中的常见误区，重点说明为何(wordforwordinsplit_lines)无法扁平化二维结构，并提供标准的嵌套生成器写法及优化方案。

239 收藏

文章 · python教程 | 2星期前 |

Python函数添加Google风格Docstring教程

GoogleDocstring采用三段式结构：简短摘要、空行、详细说明；Args:等字段顶格冒号结尾，参数名与函数签名一致，类型用str等实际名称，Returns:和Raises:需准确描述，类型提示与Docstring类型应保持一致。

104 收藏

文章 · python教程 | 2星期前 |

FastAPI登录后字段响应模型实现方法

FastAPI实现“登录后才显示某些字段”的核心是动态响应模型，可通过三种方式：一用Field(exclude=True)配合model_dump条件序列化；二定义UserPublic与UserPrivate两个模型并用Union响应类型；三用依赖注入+模型工厂函数按权限返回不同实例。

310 收藏

文章 · python教程 | 2星期前 |

Python计算余弦相似度教程

cosine_similarity对超长文本报错或不准，因其只处理向量；超长文本直接向量化易致内存爆炸、维度失控或语义失真；应先分句、用sentence-transformers编码、再均值池化并归一化后计算相似度。

110 收藏

文章 · python教程 | 2星期前 |

NumPy矩阵乘法怎么算？

推荐新代码优先用@或matmul：matmul专为矩阵乘法设计，只对最后两轴做双点积并支持广播，而dot行为复杂（一维为内积、高维易降维），易引发隐式bug。

339 收藏

文章 · python教程 | 2星期前 |

Python异步任务能重试吗？自定义装饰器实现

asyncio任务异常默认不传播且不自动重试，需手动实现重试逻辑；@async_retry装饰器须支持异常过滤、指数退避和超时兜底，避免阻塞事件循环。

226 收藏

文章 · python教程 | 2星期前 |

Scikit-learn增量学习：partial\_fit处理大数据

支持partial_fit的模型包括SGDClassifier、SGDRegressor、PassiveAggressiveClassifier、MiniBatchKMeans和MultinomialNB；RandomForestClassifier和SVC等不支持，调用会报AttributeError。

264 收藏

文章 · python教程 | 2星期前 |

带状态的Python装饰器怎么实现

类实现带状态的装饰器更可靠，因类实例天然独立持状态，而闭包易因共享自由变量导致错乱；必须实现__init__（存func、初始化静态状态）和__call__（处理动态行为），缺一不可。

198 收藏