python教程技术文章-Golang学习网

文章 · python教程 | 2星期前 |

在编程中，使用 in 检查可打印字节是否属于某个集合，通常比用区间比较（如 0x20 <= byte <= 0x7E）更快的原因主要有以下几点：1. 集合查找的底层优化Python 中的 set 是基于哈希表实现的，查找操作的时间复杂度是 O(1)。而使用 in 判断一个字节是否在集合中，实际上是在进行一次哈希查找。相比之下，使用区间判断（如 0x20 <= byte <= 0x7E）虽然逻辑简单

Python中xinbytearray(string.printable)比手动写(x>=32andx<=126)or(x>=9andx<=13)更快，主因是前者底层调用高度优化的C函数memchr，且字节级成员检测被编译为更少的字节码指令（34vs52条），显著降低解释器开销。

119 收藏

文章 · python教程 | 2星期前 |

Python有序列表合并：双指针归并法解析

双指针合并两个有序列表可实现O(m+n)时间复杂度，优于拼接后排序的O((m+n)log(m+n))；需初始化i,j=0，比较后推进下标，一方耗尽则直接extend剩余部分，注意空列表和有序性前提。

168 收藏

文章 · python教程 | 2星期前 |

TensorFlow预测报错原因及输入方法解析

TensorFlow/Keras模型的predict()方法要求输入为张量或NumPy数组，且必须包含批处理维度；直接传入Python列表（如[10.0]）会触发“Unrecognizeddatatype”错误。TensorFlow/Keras模型的`predict()`方法要求输入为张量或NumPy数组，且必须包含批处理维度；直接传入Python列表（如`[10.0]`）会触发“Unrecognizeddataty

106 收藏

文章 · python教程 | 2星期前 |

显存不足？梯度累加+混合精度轻松解决

梯度累加需对每次loss除以accumulation_steps再backward，并仅在累积完成时调用optimizer.step()和optimizer.zero_grad()，避免梯度放大与显存泄漏。

167 收藏

文章 · python教程 | 2星期前 |

pytest-html生成HTML测试报告教程

pytest-html可生成带样式、可折叠、含图表的HTML报告，但需配置--self-contained-html、--override-ini="console_output_style=classic"或conftest.py中设tbstyle="long"以显示完整traceback，并用--metadata和--override-ini="html_title=..."添加环境信息与自定义标题。

321 收藏

文章 · python教程 | 2星期前 |

Python aiofiles 正确使用方法

必须用asyncwithaiofiles.open()，不可await后手动close；需显式指定encoding='utf-8'读文本；mode='w'不自动建父目录；aiofiles文件对象不能脱离asyncwith使用。

482 收藏

文章 · python教程 | 2星期前 |

Pandas多文件写入技巧详解

本文详解如何基于数据键（如时间周期、分析方法）动态分发DataFrame到多个独立Excel文件，并为每个文件写入指定工作表，避免重复覆盖或遗漏，关键在于合理组织循环结构与ExcelWriter的生命周期管理。本文详解如何基于数据键（如时间周期、分析方法）动态分发DataFrame到多个独立Excel文件，并为每个文件写入指定工作表，避免重复覆盖或遗漏，关键在于合理组织循环结构与ExcelWriter的生命周期管理。在实际数据分析流

491 收藏

文章 · python教程 | 2星期前 |

DynamoDB 批量添加属性不覆盖方法

本文详解为何连续调用put_item会导致DynamoDB记录被覆盖，并推荐使用update_item原子更新方式，配合SET操作一次性写入多个属性，确保数据完整性与并发安全性。本文详解为何连续调用`put_item`会导致DynamoDB记录被覆盖，并推荐使用`update_item`原子更新方式，配合`SET`操作一次性写入多个属性，确保数据完整性与并发安全性。在DynamoDB中，put_item的语义是「全量写

399 收藏

文章 · python教程 | 2星期前 |

Python搭建RabbitMQ分布式爬虫任务系统

直接用pika发送任务会丢消息，是因为默认未启用发布确认、队列未持久化、消息未设delivery_mode=2；漏掉任一机制，RabbitMQ重启或消费者异常时消息即丢失。

305 收藏

文章 · python教程 | 2星期前 |

Python3 中表示字母大小写，通常是指判断或转换字符串中的字符是大写还是小写。以下是一些常用的方法和代码示例：1. 判断字符是否为大写字母char = 'A' if char.isupper(): print("这是一个大写字母")2. 判断字符是否为小写字母char = 'a' if char.islower(): print("这是一个小写字母")3. 将字符转换为大写ch

答案：Python3提供多种字符串方法处理大小写，1.str.upper()将字符串转为大写；2.str.lower()转为小写；3.str.title()实现首字母大写；4.str.swapcase()互换大小写；5.isupper()、islower()、istitle()用于判断大小写状态。

192 收藏

文章 · python教程 | 2星期前 |

多级时间索引扩展与填充教程

本文详解如何基于Pandas构建包含固定分类列（如A）与多粒度时间索引（如日级B、小时级C）的完整组合空间，并自动补全缺失项为默认值（如0），适用于时间对齐、数据补齐及多维时序建模前的数据准备。

351 收藏

文章 · python教程 | 2星期前 |

在使用 asyncio.TaskGroup 时，如果其中一个任务抛出异常，默认情况下整个 TaskGroup 会取消，但不会自动传播该异常。为了在某个任务异常时整体取消并处理异常，可以结合 try-except 块和 task.cancel() 来实现。以下是一个示例代码，展示如何在某个任务异常时取消所有任务并捕获异常： import asyncio async def task1():

是的，asyncio.TaskGroup在任一子任务抛出未处理异常时会立即取消其余运行中任务并重新抛出该异常；其取消基于CancelledError，需协程主动让出控制权才能响应，且不提供失败任务元信息。

248 收藏

文章 · python教程 | 2星期前 |

提升Python应用K8s内存利用率技巧

Python在K8s中内存“虚高”、频繁OOMKilled，根本原因是CPython3.11+前不感知cgroup内存限制，即使设了512Milimit仍按宿主机内存（如8Gi）规划GC；需同时启用-Xuse_cgroups、禁用pymalloc，并手动读取/sys/fs/cgroup/memory.max调优GC阈值。

140 收藏

文章 · python教程 | 2星期前 |

DataFrame 创建嵌套列表分类列方法

本文介绍一种高效、向量化的方法，将DataFrame中某列的值依据其所属的预定义列表组（如tier1、tier2），映射为对应的层级编号（如1、2），并生成新分类列，避免显式循环，适用于数百行数据与十余个分组场景。

304 收藏

文章 · python教程 | 2星期前 |

如何识别文件系统中的条目类型

本文介绍使用pathlib替代os.walk()实现对目标路径下所有条目（包括文件、子目录、符号链接等）的准确类型识别与统一哈希统计，解决传统遍历中仅返回文件而忽略其他类型的问题。本文介绍使用pathlib替代os.walk()实现对目标路径下所有条目（包括文件、子目录、符号链接等）的准确类型识别与统一哈希统计，解决传统遍历中仅返回文件而忽略其他类型的问题。在原始代码中，开发者使用os.walk()遍历目录，但该函数的设计机制决定了它只

141 收藏