-
requests.get()不加stream=True会将整个响应体加载到内存,导致大文件下载时内存激增甚至OOM;必须显式设置stream=True并用iter_content(8192)或shutil.copyfileobj()安全分块读取。
-
Pandas数据聚合核心是groupby,需明确分组依据(单列、多列或条件)、聚合方式(内置方法或agg自定义)及结果处理(重置索引、展平列名),并注意空值处理、类型安全与性能优化。
-
PythonSSL必须启用证书验证,否则HTTPS加密形同虚设;fernet适合简单场景,AES-GCM需严管nonce;密文须base64编码后再JSON序列化;密钥应交由KMS等安全服务管理。
-
Python中异常告警需在逃逸前转为可路由事件,统一入口设于框架钩子或sys.excepthook;用logging+Filter分级提级高危异常至CRITICAL并交由专用Handler处理;Sentry需手动capture_exception且注意异步配置;装饰器适用于关键函数但须避免耗时操作与上下文缺失。
-
Python变量赋值无需声明类型,通过“=”将变量名绑定到对象,实现动态类型和引用机制,支持多重赋值与灵活命名,提升开发效率但需注意可变对象的共享副作用。
-
浅拷贝只复制第一层引用,嵌套对象仍共享;深拷贝递归复制所有层级,彻底隔离对象图;赋值b=a仅为新增引用,不创建新对象。
-
Python中函数是一等对象,可赋值、传递、存储和返回;能作参数传入(如map、sorted)或作为返回值(如闭包),支持属性操作,需区分函数对象(不带括号)与调用结果(带括号)。
-
BeautifulSoup是Python中流行的HTML解析工具,安装需运行pipinstallbeautifulsoup4和lxml;通过构建解析树可轻松提取数据,如获取标签、属性、链接文本等,支持CSS选择器精确查找,结合requests库可用于网页抓取,注意设置请求头、编码及反爬策略,适合快速上手并应用于实际项目。
-
连不上localhost:7233是因localhost解析为::1(IPv6),而服务只监听127.0.0.1:7233;应显式设service_host="127.0.0.1:7233"并确认Server已运行。
-
最常用最可靠的单例实现是重写__new__,在内存分配阶段控制实例创建,用类变量缓存并检查实例,避免__init__多次调用问题。
-
pandas.read_excel可通过sheet_name指定工作表(字符串名、整数索引或None返回全部),用skiprows跳过前N行,配合header或names自定义列名,支持整数或列表跳过特定行。
-
应始终用timezone.now()获取带时区时间,避免datetime.now();数据库存取、查询用UTC,仅展示时用timezone.localtime();跨月计算用relativedelta;新项目务必启用USE_TZ=True并配支持时区的数据库。
-
Python位数可通过platform.architecture()直接判断,如('64bit','WindowsPE')为64位;struct.calcsize("P")返回8为64位、4为32位;sys.maxsize为9223372036854775807则为64位。
-
Python列表因动态扩容、支持多类型数据、内置丰富方法及广泛兼容性成为核心数据结构,适用于存储异构数据、实现栈队列、配合推导式等场景,极大提升开发效率。
-
Pythonimport速度慢主要源于模块加载、路径搜索、字节码编译和依赖解析等环节累积;优化需减少无用导入、延迟加载、启用字节码缓存、解耦大型入口模块,并通过importtime+tuna精准定位瓶颈。