登录
首页 >  文章 >  python教程

Python股票数据获取:Tushare与Baostock对比解析

时间:2026-03-18 14:41:33 431浏览 收藏

本文深入剖析了Python中两大主流免费股票数据接口——Tushare与Baostock的核心差异与实战陷阱:从Tushare强制token鉴权、频控严格、复权由服务端完成,到Baostock依赖显式登录/登出、本地复权计算复杂、连接易断但批量查询更灵活;涵盖代码初始化、参数格式(日期/代码)、停牌处理、限流应对、常见报错根源及文档更新风险等高频踩坑点,直击量化初学者“数据拿得到却用不对”的痛点,帮你避开静默出错、回测失真、IP被封等真实困境。

Python怎么获取股票数据_Tushare与Baostock免费量化金融数据接口全解

用 Tushare 获取 A 股日线数据,token 是硬门槛

没 token 就拿不到任何数据,不是接口挂了,是 Tushare 从 2020 年起强制鉴权。免费用户注册后能拿到一个 token,但只能调用基础接口(比如 pro_bardaily),且有频次限制(1000 次/天,50 次/分钟)。

常见错误现象:TokenNotProvidedInvalid token 错误;调用 pro_api() 后直接报 AttributeError: 'NoneType' object has no attribute 'query'——大概率是 token 没生效或过期。

  • 初始化必须写成 ts = ts_pro_api(your_token_here),不能漏掉括号里的 token 字符串
  • 查沪深股票列表用 stock_basic,不是 stock_company(后者字段少、更新慢)
  • 获取日线推荐用 pro_bar 而非 daily:前者支持复权(adj='qfq''hfq'),后者默认不复权,收盘价会跳空
  • 日期参数统一用 trade_date='20230101' 格式(8 位字符串),别传 datetime 对象,否则报 TypeError: Object of type datetime is not JSON serializable

Baostock 登录失败?其实是 session 管理机制在作怪

Baostock 不需要 token,但必须先 login 才能查数据,而且登录状态只在当前 Python 进程里有效。关掉脚本或重启 kernel,就得重新 bs.login()

常见错误现象:bs.query_history_k_data_plus(...) 返回空表,或者报 AttributeError: 'NoneType' object has no attribute 'get_data_list'——基本等于没成功登录,或登录后被服务端断连(比如请求太密集)。

  • 每次运行前都加一句 lg = bs.login(),并检查 lg.error_code == '0',别只看 print 输出
  • 股票代码格式必须是 'sh.600000''sz.000001',错写成 '600000.SH' 会静默返回空结果
  • 查询日线时,start_dateend_date 是字符串(如 '2022-01-01'),和 Tushare 的 8 位格式不同,混用会查不到数据
  • 它不支持并发请求,连续调用 5 次以上 query_history_k_data_plus 可能触发风控,建议每次间隔 time.sleep(0.3)

Tushare 和 Baostock 的复权逻辑根本不一样

复权不是“开关”,是计算路径差异。Tushare 的 pro_bar 在服务端算好再返回,Baostock 的 adjustflag 字段只是标记,得自己用公式补全——这点很多人栽跟头。

使用场景:做回测必须用前复权价,否则买卖点对不上;但研究分红节奏得用不复权数据。

  • Tushare 设置 adj='qfq' 就完事,返回的 close 列已经是前复权价格
  • Baostock 默认返回不复权数据,adjustflag=1 表示当天有除权,但不会自动调整历史价格;你要自己按公式推:新价格 = 旧价格 × (1 + 送股比例) / (1 + 送股比例 + 配股比例 × 配股价 / 除权前收盘价)
  • 两者对“停牌日”的处理也不同:Tushare 的 pro_bar 默认跳过停牌日(除非加 freq='d' 且指定 ma 参数),Baostock 则保留,close 值等于前一日收盘

高频取数时,Tushare 的 ratelimit 比 Baostock 的连接稳定性更难控

Tushare 免费版的限流是硬策略:超了就直接 429,没商量;Baostock 虽然没明说限流,但服务器容易断连,尤其批量查几百只股票时。

性能影响:Tushare 单次 pro_bar 最多拉 8000 条记录(约 30 年日线),想查全 A 股得循环调用;Baostock 单次最多 1000 条,但支持一次性传入多个代码(用逗号拼接),实际吞吐可能更高。

  • 批量取 Tushare 数据,别用 for 循环暴力请求,改用 pool.map + time.sleep(0.1) 控制节奏,否则半小时内就会被封 IP
  • Baostock 的 bs.logout() 必须显式调用,否则进程残留连接,下次 login 可能失败
  • 两者都不适合实时盯盘:Tushare 日频数据 T+1,Baostock 也是收盘后几小时才更新,盘中要用它们查最新价,大概率拿到的是昨日收盘

真正麻烦的不是怎么写那几行代码,而是得随时盯着两个库的文档更新页——Tushare 的 pro_bar 接口去年悄悄把默认复权方式从不复权改成后复权,Baostock 的 adjustflag 含义也在小版本里微调过。不翻 changelog,数据就 quietly 错了。

今天带大家了解了的相关知识,希望对你有所帮助;关于文章的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>