首页 > 科技周边 > 人工智能

450美元训练一个「o1-preview」？UC伯克利开源32B推理模型Sky-T1，AI社区沸腾了

时间：2025-01-20 13:10:14 373浏览收藏

今日不肯埋头，明日何以抬头！每日一句努力自己的话哈哈~哈喽，今天我将给大家带来一篇《450美元训练一个「o1-preview」？UC伯克利开源32B推理模型Sky-T1，AI社区沸腾了》，主要内容是讲解等等，感兴趣的朋友可以收藏或者有更好的建议在评论提出，我都会认真看的！大家一起进步，一起学习！

仅需450美元，就能训练出一个320亿参数的推理模型？这听起来难以置信，但在2025年，这已成为现实。加州大学伯克利分校天空计算实验室的NovaSky团队发布了Sky-T1-32B-Preview模型，其训练成本仅为450美元，这在以往是无法想象的。

Sky-T1-32B-Preview在多个基准测试中与OpenAI早期版本的o1模型性能相当。更令人瞩目的是，该团队完整开源了训练数据、代码和模型权重，实现了真正的开源。

这与以往动辄数百万美元的模型训练成本形成鲜明对比。合成数据和其它模型生成的训练数据，大幅降低了训练成本。例如，Writer公司发布的Palmyra X 004模型，其开发成本仅为70万美元。

未来，在价格低廉的Nvidia Project Digits AI超级计算机（3000美元）上，甚至个人电脑上，运行参数量巨大的模型将成为可能。

大模型技术发展日新月异，Sky-T1的出现无疑是里程碑式的事件。

模型概述与技术细节

Sky-T1-32B-Preview在数学和编码领域都展现出强大的推理能力，并开源了所有细节，包括数据、代码和模型权重，方便社区复制和改进。

其数据整理过程使用了开源模型QwQ-32B-Preview，并借鉴了Still-2的方法，对数据进行了清洗和重构，提高了数据质量和解析效率。训练过程使用了Qwen2.5-32B-Instruct模型，并在8个H100显卡上进行了训练。

评估结果显示，Sky-T1在部分基准测试中超越了OpenAI o1的早期版本，但也存在一些不足。

研究团队也总结了一些重要发现，例如模型大小和数据混合对模型性能的影响。

Sky-T1-32B-Preview的出现，预示着大模型训练成本的显著下降，以及开源社区的蓬勃发展。但这项研究也引发了一些讨论和质疑，值得进一步关注。

到这里，我们也就讲完了《450美元训练一个「o1-preview」？UC伯克利开源32B推理模型Sky-T1，AI社区沸腾了》的内容了。个人认为，基础知识的学习和巩固，是为了更好的将其运用到项目中，欢迎关注golang学习网公众号，带你了解更多关于产业,NovaSky的知识点！

产业 NovaSky