python教程技术文章-Golang学习网

文章 · python教程 | 2个月前 |

Pythonif语句使用详解

Python中if语句通过if、elif、else实现条件分支，依赖缩进和冒号定义代码块，支持比较、逻辑、成员运算符及真值性判断，可结合all()、any()、条件表达式和字典映射提升简洁性与可读性。

117 收藏

文章 · python教程 | 2个月前 |

mock\_open模拟open函数调用方法

本文旨在解决在单元测试中，如何使用unittest.mock.mock_open来模拟类方法中open函数的调用，从而避免实际的文件写入操作，并验证写入的内容。通过正确的patch目标和调用方式，可以有效地测试与文件操作相关的代码逻辑。

426 收藏

文章 · python教程 | 2个月前 |

Python日志配置与使用全解析

Python日志记录通过logging模块实现，核心组件包括Logger、Handler、Formatter和Filter。使用basicConfig可快速配置，而复杂场景可通过自定义Logger和Handler将日志输出到控制台、文件或滚动文件。相比print，logging支持级别控制（DEBUG、INFO、WARNING、ERROR、CRITICAL），可灵活配置输出目标与格式，适用于调试、监控和生产环境。通过FileHandler写入文件，RotatingFileHandler按大小滚动，Time

176 收藏

文章 · python教程 | 2个月前 |

PyMuPDF分割PDF与目录生成教程

本教程详细介绍了如何使用PyMuPDF库高效地按页码范围分割PDF文件，并为每个分割后的文件动态生成并维护对应的目录（TOC）。文章重点阐述了PyMuPDF中TOC结构的严格规则，包括层级（level）的合法性检查与调整策略，特别是通过添加“虚拟”条目来确保TOC的正确性，从而实现分割PDF后TOC的完整保留和可用性。

432 收藏

文章 · python教程 | 2个月前 |

Python解析HTML：BeautifulSoup与lxml实战教程

答案是BeautifulSoup和lxml各有优势，适用于不同场景。BeautifulSoup容错性强、API直观，适合处理不规范HTML和快速开发；lxml基于C实现，解析速度快，适合处理大规模数据和高性能需求。两者可结合使用，兼顾易用性与性能。

145 收藏

文章 · python教程 | 2个月前 | HTML解析数据提取 Requests beautifulsoup Python爬虫

Python爬虫实战：requests+BeautifulSoup教程

使用Python抓取网页数据时，requests和BeautifulSoup是最常用的组合。requests用于发送HTTP请求并获取网页内容，而BeautifulSoup则用于解析HTML并提取所需数据。1.安装依赖库：使用pipinstallrequestsbeautifulsoup4或加国内源安装；2.获取网页内容：通过requests.get()方法发送请求，并加入异常处理和headers模拟浏览器访问；3.解析HTML：用BeautifulSoup初始化解析器，利用find、find_all和s

303 收藏

文章 · python教程 | 2个月前 |

Python去重方法与drop\_duplicates参数详解

数据去重在数据分析中至关重要，因为它确保了数据的准确性、减少资源浪费并提升数据质量。1.使用Pandas库中的drop_duplicates()方法是最常见且强大的工具；2.该方法支持通过subset参数指定去重的列，默认检查所有列；3.keep参数控制保留重复项的方式，可选'first'（默认）、'last'或False（删除所有重复项）；4.inplace参数允许直接在原数据上操作；5.去重常用于移除完全重复记录、提取最新状态或找出唯一记录等场景，结合排序等操作能更灵活应对实际需求。

271 收藏

文章 · python教程 | 2个月前 |

Python全局变量定义详解

在Python中，global关键字用于在函数内部修改全局变量。1)global关键字允许函数内部修改全局变量，而非创建新局部变量。2)使用global提高代码可读性和可维护性，但需谨慎，因可能增加代码复杂度。3)替代方案包括使用函数参数和返回值，或单例模式管理共享状态，提升代码模块化和可维护性。

485 收藏

文章 · python教程 | 2个月前 |

Pandas多条件生成新列技巧

本文深入探讨了在Pandas数据框中基于多列条件创建新列的有效方法。首先，纠正了列表推导式中迭代多个Series的常见语法错误，强调了zip函数的重要性。接着，介绍了如何利用df.apply()结合自定义函数处理更复杂的条件逻辑，提升代码的可读性和可维护性。旨在帮助读者根据业务需求选择最合适的策略，高效地进行数据处理。

158 收藏

文章 · python教程 | 2个月前 | 启动速度 compileall Python字节码 .pyc文件字节码生成

Python生成字节码的命令与方法详解

直接运行Python脚本时，若被导入则自动生成.pyc文件；2.使用py_compile.compile('my_script.py')可手动编译生成指定.pyc文件；3.使用compileall.compile_dir('my_directory')或python-mcompileallmy_directory可批量编译目录下所有.py文件；4.设置PYTHONDONTWRITEBYTECODE环境变量可禁用.pyc文件生成；5.解决版本不兼容需使用对应Python版本编译，推荐通过venv创建虚拟环境

292 收藏

文章 · python教程 | 2个月前 |

Python用pct\_change计算数据增长方法

在Python中计算增长率时，pct_change方法是首选，因为它简化了代码、内置处理NaN值，并支持灵活的周期参数。首先，它一行代码即可完成增长率计算，提升开发效率；其次，自动处理缺失值，避免除零错误；再者，通过periods参数轻松应对不同周期分析需求。对于缺失值，可在计算前使用fillna填充、interpolate插值或dropna删除；对于异常值，可通过统计识别、平滑处理或对数变换减轻影响。进阶用法包括累计增长率计算、分组增长率分析，并结合原始数据和趋势平滑进行深入分析。

293 收藏

文章 · python教程 | 2个月前 | Python 效率语法生成器表达式列表推导式

Python列表推导式教程与实例解析

列表推导式是一种简洁高效的创建列表的方式，核心语法为[表达式for变量in可迭代对象if条件]，支持单层或多层嵌套、多条件过滤，相比传统循环更高效且更具可读性，但在复杂逻辑或大数据场景下应避免过度使用，可结合生成器表达式优化内存消耗。

153 收藏

文章 · python教程 | 2个月前 |

Azure管道变量如何保存到Git仓库

本文详细介绍了如何在AzureDevOps管道中将动态生成的变量（如API返回的JSON数据）持久化存储到Git仓库。核心方法包括将变量内容序列化并写入本地文件，然后利用Git命令行工具在管道中执行文件添加、提交和推送操作，从而实现数据版本化管理。文章提供了详细的代码示例和操作步骤，并探讨了相关注意事项。

354 收藏

文章 · python教程 | 2个月前 |

Python高效提取嵌套JSON数据教程

本教程详细讲解如何在Python中访问深层嵌套的JSON或字典列表数据。通过分析数据结构，本教程将展示如何正确结合使用列表索引和字典键来精确提取所需信息，并提供迭代、错误处理及最佳实践，帮助开发者避免常见的KeyError或IndexError，从而高效、稳健地处理复杂数据。

422 收藏

文章 · python教程 | 2个月前 |

PythonOpenCV图像识别教程详解

1.数据是图像识别的基础，必须收集大量标注数据；2.根据任务类型选择模型，分类任务用ResNet、VGG，检测任务用YOLO、SSD，分割任务用U-Net、MaskR-CNN；3.考虑资源限制，边缘设备优先选用MobileNet、ShuffleNet等轻量级模型；4.数据不足时采用迁移学习结合预训练模型；5.使用OpenCV的dnn模块加载模型并进行推理，核心步骤包括读取模型文件、图像预处理、执行前向传播及解析结果；6.实践中应对挑战的方法包括数据增强缓解数据不足、正则化和Dropout防止过拟合、调整模

257 收藏