python教程技术文章-Golang学习网

Go教程 Go问答 MySQL Redis 软件教程人工智能业界新闻 php教程 java教程 python教程 linux 前端常见问题 AI提示词作文画画

三天内

一周内

一月内

三月内

文章 · python教程 | 19小时前 |

Pandas 2.0用Arrow加速字符串处理

PyArrow引擎在Pandas2.0中需显式启用：读CSV时设dtype_backend="pyarrow"，或单列指定string[pyarrow]；后者内存更优、支持向量化字符串操作且快3–5倍，但需注意多进程序列化、库兼容性及NA处理等坑。

267 收藏
文章 · python教程 | 1天前 |

结构化日志实践：Python高效管理指南

Loguru更适合快速落地因其默认支持结构化输出、自动轮转和线程安全，无需手动配置handler/formatter/level；structlog依赖绑定机制与上下文管理器维持请求上下文；JSON中文转义需设置ensure_ascii=False；字段命名应统一snake_case以利日志查询。

265 收藏
文章 · python教程 | 2天前 |

Python解决数据不平衡：SMOTE过采样教程

SMOTE并非万能开关，常因特征未标准化、k_neighbors过大或全局调用导致precision下降、F1降低；正确做法是在imblearn.Pipeline中前置StandardScaler、设k_neighbors=3，并在交叉验证内局部重采样。

262 收藏
文章 · python教程 | 1天前 |

Scrapy分页爬取：提取下一页URL并继续抓取

应显式用response.css()或xpath提取下一页URL，经response.urljoin()补全后，以scrapy.Request(callback=self.parse)发起请求；避免依赖response.follow()默认回调、硬编码start_urls或忽略去重与并发控制。

262 收藏
文章 · python教程 | 17小时前 |

Python静态方法、类方法与实例方法详解

用@staticmethod还是@classmethod取决于是否需访问类本身：无需类或实例依赖仅逻辑封装用@staticmethod；需读取cls、调用类方法或支持子类自动适配用@classmethod。

262 收藏
文章 · python教程 | 2天前 |

Python敏感词过滤：DFA与正则匹配实战教程

DFA比正则更适合敏感词过滤，因其预构状态转移图后单次扫描即可完成所有匹配，时间复杂度稳定为O(n)，而正则需逐条匹配、回溯频繁，词库超500条时性能断崖下降。

260 收藏
文章 · python教程 | 6小时前 |

Python落地企业数据分析流程详解

Python在企业落地数据分析的核心是打通“数据→分析→决策→反馈”闭环。需稳定对接数据库/API等真实数据源，分析过程要可复现、可解释，结果须嵌入业务系统（如API、企微机器人），并建立反馈闭环验证效果。

259 收藏
文章 · python教程 | 1天前 |

优化Paramiko连接Linux服务器速度技巧

根本原因是SSH握手阶段的DNS反向解析；远程sshd配置UseDNSyes时，会对客户端IP执行阻塞式gethostbyaddr()查询，无PTR记录或DNS慢则卡住30秒，Paramikoconnect()随之挂起。

254 收藏
文章 · python教程 | 1天前 |

BiLSTM-CRF中文实体识别模型解析

BiLSTM-CRF是中文NER任务中效果、可控性与工程落地成熟度兼顾的首选，需以字为单位输入、CRF转移矩阵必须可训练、评估须用seqeval而非accuracy。

251 收藏
文章 · python教程 | 2天前 |

Pandas合并DataFrame：merge实现内外连接详解

pd.merge()默认是内连接而非按行拼接，只保留连接键在左右表中都存在的行；常见错误包括类型不一致、列名不同、重复键导致笛卡尔积，应检查dtypes、统一列名、合理选how参数，并避免误用merge替代concat。

245 收藏
文章 · python教程 | 7小时前 |

Python自动填写复杂表单技巧：Selenium ActionChains使用教程

表单元素找不到需先确认是否在iframe中，必须用switch_to.frame()切换上下文；下拉、日期、富文本等控件需模拟真实用户操作；ActionChains.click()不生效时检查遮挡或就绪状态；填完需手动触发change等事件，提交前验证按钮状态。

245 收藏
文章 · python教程 | 6小时前 |

Python数据模型教程：对象协议与行为定制

Python数据模型的核心是协议，即通过实现特定方法（如__len__、__getitem__等）使对象支持对应操作；常用协议包括__init__/__new__、__str__/__repr__、__eq__/__hash__、__contains__，且协议间存在隐含约束。

241 收藏
文章 · python教程 | 18小时前 |

Flask全局变量配置：g对象与上下文处理器详解

Flask中g对象仅在请求上下文中有效，生命周期始于@app.before_request、终于响应发出，不可跨请求共享；模板中无法直接访问g，需用add_template_global注册Jinja2全局变量；跨请求状态应使用session或Redis，避免g名冲突需加前缀。

238 收藏
文章 · python教程 | 2天前 |

Scikit-learn绘制ROC曲线教程

ROC曲线画不出需确认输入为正类概率或决策函数值；多模型ROC需复用ax参数叠加绘制；AUC值与曲线不匹配常因混淆AP与AUC或未正确处理多分类；保存高清图应调用tight_layout()于legend后并设bbox_inches='tight'。

234 收藏
文章 · python教程 | 18小时前 |

pytest失败用例自动重跑配置方法

pytest-rerunfailures通过pip安装后，用--rerunsN启用重跑，仅对测试逻辑失败生效；支持@pytest.mark.rerun装饰器按用例粒度配置次数与延迟；需确保fixture隔离避免状态污染；CI中建议结合--reruns-verbose和--junitxml查看重试详情。

225 收藏

1 6 7 8 10