Python股票数据获取:Tushare与Baostock对比解析
时间:2026-03-18 14:41:33 431浏览 收藏
本文深入剖析了Python中两大主流免费股票数据接口——Tushare与Baostock的核心差异与实战陷阱:从Tushare强制token鉴权、频控严格、复权由服务端完成,到Baostock依赖显式登录/登出、本地复权计算复杂、连接易断但批量查询更灵活;涵盖代码初始化、参数格式(日期/代码)、停牌处理、限流应对、常见报错根源及文档更新风险等高频踩坑点,直击量化初学者“数据拿得到却用不对”的痛点,帮你避开静默出错、回测失真、IP被封等真实困境。

用 Tushare 获取 A 股日线数据,token 是硬门槛
没 token 就拿不到任何数据,不是接口挂了,是 Tushare 从 2020 年起强制鉴权。免费用户注册后能拿到一个 token,但只能调用基础接口(比如 pro_bar、daily),且有频次限制(1000 次/天,50 次/分钟)。
常见错误现象:TokenNotProvided 或 Invalid token 错误;调用 pro_api() 后直接报 AttributeError: 'NoneType' object has no attribute 'query'——大概率是 token 没生效或过期。
- 初始化必须写成
ts = ts_pro_api(,不能漏掉括号里的 token 字符串your_token_here) - 查沪深股票列表用
stock_basic,不是stock_company(后者字段少、更新慢) - 获取日线推荐用
pro_bar而非daily:前者支持复权(adj='qfq'或'hfq'),后者默认不复权,收盘价会跳空 - 日期参数统一用
trade_date='20230101'格式(8 位字符串),别传datetime对象,否则报TypeError: Object of type datetime is not JSON serializable
Baostock 登录失败?其实是 session 管理机制在作怪
Baostock 不需要 token,但必须先 login 才能查数据,而且登录状态只在当前 Python 进程里有效。关掉脚本或重启 kernel,就得重新 bs.login()。
常见错误现象:bs.query_history_k_data_plus(...) 返回空表,或者报 AttributeError: 'NoneType' object has no attribute 'get_data_list'——基本等于没成功登录,或登录后被服务端断连(比如请求太密集)。
- 每次运行前都加一句
lg = bs.login(),并检查lg.error_code == '0',别只看 print 输出 - 股票代码格式必须是
'sh.600000'或'sz.000001',错写成'600000.SH'会静默返回空结果 - 查询日线时,
start_date和end_date是字符串(如'2022-01-01'),和 Tushare 的 8 位格式不同,混用会查不到数据 - 它不支持并发请求,连续调用 5 次以上
query_history_k_data_plus可能触发风控,建议每次间隔time.sleep(0.3)
Tushare 和 Baostock 的复权逻辑根本不一样
复权不是“开关”,是计算路径差异。Tushare 的 pro_bar 在服务端算好再返回,Baostock 的 adjustflag 字段只是标记,得自己用公式补全——这点很多人栽跟头。
使用场景:做回测必须用前复权价,否则买卖点对不上;但研究分红节奏得用不复权数据。
- Tushare 设置
adj='qfq'就完事,返回的close列已经是前复权价格 - Baostock 默认返回不复权数据,
adjustflag=1表示当天有除权,但不会自动调整历史价格;你要自己按公式推:新价格 = 旧价格 × (1 + 送股比例) / (1 + 送股比例 + 配股比例 × 配股价 / 除权前收盘价) - 两者对“停牌日”的处理也不同:Tushare 的
pro_bar默认跳过停牌日(除非加freq='d'且指定ma参数),Baostock 则保留,close值等于前一日收盘
高频取数时,Tushare 的 ratelimit 比 Baostock 的连接稳定性更难控
Tushare 免费版的限流是硬策略:超了就直接 429,没商量;Baostock 虽然没明说限流,但服务器容易断连,尤其批量查几百只股票时。
性能影响:Tushare 单次 pro_bar 最多拉 8000 条记录(约 30 年日线),想查全 A 股得循环调用;Baostock 单次最多 1000 条,但支持一次性传入多个代码(用逗号拼接),实际吞吐可能更高。
- 批量取 Tushare 数据,别用 for 循环暴力请求,改用
pool.map+time.sleep(0.1)控制节奏,否则半小时内就会被封 IP - Baostock 的
bs.logout()必须显式调用,否则进程残留连接,下次 login 可能失败 - 两者都不适合实时盯盘:Tushare 日频数据 T+1,Baostock 也是收盘后几小时才更新,盘中要用它们查最新价,大概率拿到的是昨日收盘
真正麻烦的不是怎么写那几行代码,而是得随时盯着两个库的文档更新页——Tushare 的 pro_bar 接口去年悄悄把默认复权方式从不复权改成后复权,Baostock 的 adjustflag 含义也在小版本里微调过。不翻 changelog,数据就 quietly 错了。
今天带大家了解了的相关知识,希望对你有所帮助;关于文章的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
295 收藏
-
336 收藏
-
218 收藏
-
463 收藏
-
295 收藏
-
178 收藏
-
103 收藏
-
284 收藏
-
475 收藏
-
330 收藏
-
251 收藏
-
120 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习