-
Python字典本身不支持LRU淘汰,需用OrderedDict实现:通过move_to_end()置顶访问项、popitem(last=False)删除最老项,确保“最近读取优先”;@lru_cache仅适用于可哈希参数且按数量限容的场景。181 收藏 -
Python中将datetime对象转换为字符串主要使用strftime()方法,通过格式代码如%Y、%m、%d等控制输出样式,例如now.strftime("%Y-%m-%d%H:%M:%S")可生成标准时间字符串。178 收藏 -
groupby后agg返回Series或DataFrame取决于聚合参数类型:单函数单列聚合常返Series,多函数、字典或列表参数则返DataFrame;混用lambda易报错,应优先用内置字符串函数。175 收藏 -
Django模板中变量用{{var}}自动转义,需可信内容才用|safe;标签如if/for不支持Python语法;static/url需先{%load%}且路径依赖配置;简单格式化用filter,复杂逻辑用simple_tag。169 收藏 -
Frame是Tkinter中用于组织控件的容器,需显式布局才可见,嵌套时各层grid坐标系独立,调试可用relief/bd加边框,禁混用pack/grid,深嵌套建议类封装。168 收藏 -
Python处理大规模日志需流式读取、预编译正则提取字段、结构化写入CSV或JSONLines、分块输出、加进度提示与断点续跑,确保内存可控、格式一致、鲁棒可维护。164 收藏 -
Windows下用attrib+h设隐藏属性最可靠,需绝对路径并加/s/d处理子目录;Linux隐藏靠文件名前缀.,重命名即可;跨平台不应强行统一逻辑,应按sys.platform区分处理。163 收藏 -
value_counts()仅适用于Series,多列组合频次需先groupby再调用;normalize=True按每组内部归一化,非全局;dropna=False需在groupby中设置才保留含NaN分组。162 收藏 -
数据分析师需掌握基础模型部署能力,将训练好的模型转化为可调用服务,如FlaskAPI或Streamlit页面,通过输入校验、异常兜底和版本标记保障稳定性,并可用Render或HuggingFaceSpaces低门槛上云。161 收藏 -
Python集合天生无序,因基于哈希表实现以优化去重和成员检测;其遍历顺序受哈希分布、扩容重散列及版本差异影响而不稳定,不可依赖。161 收藏 -
asyncio.Lock()必须await才生效,直接调用acquire()不阻塞;正确用法是awaitlock.acquire()或asyncwithlock:,且不可跨线程使用,仅适用于同eventloop内的异步上下文。161 收藏 -
Python内存泄漏主因是程序逻辑导致对象无法及时回收,常见于全局缓存未清理、回调未解绑、循环引用配合__del__及弱引用使用不当;应检查全局容器、用WeakValueDictionary、加清理策略、确保回调解绑、避免__del__、用tracemalloc等工具定位引用链。159 收藏 -
推荐初学者用标准库weakref自定义事件总线,生产项目用blinker库;核心是解耦模块依赖,需防范循环发布、异常中断、生命周期错配等陷阱。159 收藏 -
vm.dirty_background_ratio=5会导致后台回写过早触发,易引发iowait升高和延迟抖动;应与vm.dirty_ratio保持至少5%差值,并配合调大vm.dirty_expire_centisecs以合并刷盘、降低I/O频次。153 收藏 -
梯度检查点是通过只保存部分中间激活值、反向时重算前向来节省显存的技术,能降低40%~60%显存但增加15%~30%训练时间,要求模块前向可重入且无副作用。153 收藏