python教程技术文章-Golang学习网

文章 · python教程 | 2个月前 |

本文介绍如何通过标准输出（stdout）替代文件写入的方式，使运行在临时Docker容器中的定时批处理任务（如PythonETL脚本）日志可持久化采集、查看与管理，并兼容本地cron及云平台（如GoogleCloudScheduler）部署场景。

150 收藏

文章 · python教程 | 2个月前 |

UDP丢包原因与缓冲区优化方法

本文深入解析UDP单向传输场景下“发送端日志显示全部发出，但接收端持续丢失末尾数据包”的典型问题，揭示其本质是操作系统收发缓冲区失衡所致，并提供可落地的socket参数调优方案。

380 收藏

文章 · python教程 | 2个月前 |

Python递归遍历多层字典与JSON方法

遇到嵌套字典报RecursionError主因是循环引用而非层级深；应使用id()去重、栈模拟递归、生成器yield提取字段，并警惕object_hook性能陷阱及非内置dict类型兼容性问题。

135 收藏

文章 · python教程 | 2个月前 |

Python简易缓存系统实现教程

用dict+时间戳实现带过期的内存缓存类，支持set(key,value,ttl)和get(key)，读取时自动清理过期项；多线程下加threading.Lock保障安全；纯计算场景可直接用@lru_cache；需持久化可序列化到JSON文件。

469 收藏

文章 · python教程 | 2个月前 | 函数列表

Python数字列表处理函数全解析

使用sum、max、min和len计算列表的和、最大值、最小值及平均值；2.用filter结合lambda筛选偶数等符合条件的元素；3.用map对每个元素平方等映射操作；4.用sorted排序，set去重并排序，注意map和filter返回迭代器需转list。

283 收藏

文章 · python教程 | 2个月前 |

Python大文件高效写入方法解析

默认write()频繁小IO导致性能下降，因缓冲区易满而多次系统调用；应显式增大buffering（如64KB）或批量拼接后一次写入。

350 收藏

文章 · python教程 | 2个月前 |

Python大文件分块读取与内存优化方法

用open()配合read(size)分块读取大文件最直接高效，应使用'rb'模式、2的幂size（如65536），避免按行读取和编码中断问题，必要时对UTF-8边界做安全回退处理。

246 收藏

文章 · python教程 | 2个月前 |

Dask处理大内存数据的分布式特征提取方法

dask.delayed更适合特征提取pipeline，因其支持任意带状态、依赖外部资源或非向量化函数的Python逻辑，粒度细、易调试；而dask.array和dask.bag分别受限于纯数组运算和无序/高shuffle成本。

465 收藏

文章 · python教程 | 2个月前 |

Pythongroupby多函数聚合技巧

groupby后agg返回Series或DataFrame取决于聚合参数类型：单函数单列聚合常返Series，多函数、字典或列表参数则返DataFrame；混用lambda易报错，应优先用内置字符串函数。

175 收藏

文章 · python教程 | 2个月前 |

Python路径结构详解与使用技巧

路径由根目录、目录层级、文件名和特殊符号组成，Windows用C:\或/为根，Linux/macOS以/为根；目录间用/或\分隔，推荐用os.sep或pathlib避免兼容问题；文件名含主名与扩展名；.代表当前目录，..为上级目录，~指用户主目录，应使用os.path或pathlib模块处理路径。

498 收藏

文章 · python教程 | 2个月前 |

Flask日志配置与错误记录方法

Flask默认日志不写入文件是因为开发服务器仅输出到stderr且未配置文件handler；生产环境日志更易被WSGI接管或丢弃。常见问题包括basicConfig失效、日志仅显示在终端、重启后文件为空及多进程错乱。根本原因是app.logger是独立实例，不继承rootlogger配置，且Flask启动时已添加StreamHandler，basicConfig仅在root无handler时生效；同时若未显式设置日志级别，WARNING以下消息会被过滤。可靠写法是直接为app.logger添加Rotati

294 收藏

文章 · python教程 | 2个月前 |

提升Python数据处理代码的测试性设计

pandas.read_csv不该直接写在测试用例里，因其会引入外部文件路径、编码、网络及CSV格式变化等不稳定依赖；应改用内存数据构造、StringIO模拟或显式参数化输入。

292 收藏

文章 · python教程 | 2个月前 |

Python脚本版本管理实用技巧

应通过shebang硬编码小版本号（如#!/usr/bin/envpython3.9）并运行时检查sys.version_info，配合自动检测安装依赖和Git自动生成版本号来确保Python脚本版本可控、依赖可用、版本可追溯。

135 收藏

文章 · python教程 | 2个月前 |

Python时间序列预测入门教程

Web时间序列预测核心是安全稳定直观地提供预测能力，需模型与部署分离、合理API设计、简洁前端展示；推荐ARIMA/SARIMAX、Prophet、LightGBM/XGBoost等轻量可解释模型，用FastAPI构建带校验与缓存的预测接口，前端以ECharts+Axios实现趋势可视化。

398 收藏

文章 · python教程 | 2个月前 |

PostgreSQL上使用on_conflict_do_update实现Upsert

SQLAlchemy实现upsert有三种方式：一是Core层数据库原生语法（PostgreSQL用on_conflict_do_update、MySQL用on_duplicate_key_update、SQLite用on_conflict_do_update），高效且避免竞态；二是ORM层bulk_upsert_mappings（2.0+），批量处理、不触发事件；三是merge()，自动查再更/插但有性能开销。

465 收藏