python教程技术文章-Golang学习网

文章 · python教程 | 2个月前 |

在Python中使用io.BytesIO与zipfile.ZipFile构建内存ZIP时，若在ZipFile上下文管理器结束前读取缓冲区，会导致ZIP结构不完整（缺少中央目录），从而产生损坏文件。关键在于必须等待ZipFile.__exit__完成写入后，再读取数据。

424 收藏

文章 · python教程 | 2个月前 |

Python不平衡数据处理：SMOTE与随机欠采样实战

SMOTE效果变差因盲目过采样放大噪声、生成错误区域样本，尤其在高维稀疏或类别重叠时；须仅在训练集操作、先降维或调k值、检查重复行。

399 收藏

文章 · python教程 | 2个月前 |

按日期筛选时间序列，设置DatetimeIndex查询方法

必须先用pd.to_datetime()转换日期列类型并用set_index()设为DatetimeIndex，再通过字符串切片或loc+pd.Timestamp按时间范围查询，且需确保索引已排序、时区一致。

335 收藏

文章 · python教程 | 2个月前 |

PythonOpenCV图像特效与增强教程

OpenCV可通过组合高斯模糊、双边滤波、肤色检测等实现轻量级实时美颜；分层修复老照片划痕与褪色；基于轮廓与凸包缺陷识别手势；利用单应性矩阵与透视变换实现实时AR贴纸与文字。

243 收藏

文章 · python教程 | 2个月前 |

Python多层爬虫架构与调度策略解析

Python多层爬虫调度系统核心是分层解耦、职责清晰、可扩可控，含任务管理、调度中心、执行代理、结果归集四层，通过Redis/Kafka等中间件轻量通信，强调稳准有度的策略设计与小闭环迭代演进。

306 收藏

文章 · python教程 | 2个月前 |

Python爬虫抓取受限网站技巧

加User-Agent仍被403因网站校验多字段，需配套Accept、Accept-Language、Referer等，且headers应复用真实请求、用Session管理并避免过度模拟。

439 收藏

文章 · python教程 | 2个月前 |

Python快速识别异常值：3Sigma与箱线图过滤方法

3Sigma在业务数据中常失效，因业务数据多非正态分布，如订单时间集中早晚高峰、销售额长尾暴增、IoT读数存在系统性漂移；直接用numpy.std()计算标准差并应用于右偏订单金额，易误删大额客户；且3Sigma对离群点敏感，极端值会拉高标准差导致漏检；应先可视化分布形态，优先选用分位数法，或改用中位数与MAD等稳健估计。

390 收藏

文章 · python教程 | 2个月前 |

PythonPonyORM查询技巧全解析

query()方法返回的是惰性求值的可迭代对象，即Query实例，非原生生成器或列表；遍历、list()、first()等操作才触发SQL执行，多次遍历会重复查询。

410 收藏

文章 · python教程 | 2个月前 |

Pytest钩子发飞书通知，测试结果实时提醒

pytest的pytest_runtest_makereport钩子通过判断report.when=="call"且notreport.passed来精准捕获失败用例，避免误捕setup/teardown异常；应使用report.longreprtext获取堆栈，弃用已废弃的report.outcome。

187 收藏

文章 · python教程 | 2个月前 |

Pythonshutil.move移动文件与目录详解