首页 > 科技周边 > 人工智能

低计算和内存需求的小型 Llama 大模型

来源：51CTO.COM

时间：2024-03-12 21:09:35 221浏览收藏

推广推荐

支持 PC / 移动端，安全直达

偷偷努力，悄无声息地变强，然后惊艳所有人！哈哈，小伙伴们又来学习啦~今天我将给大家介绍《低计算和内存需求的小型 Llama 大模型》，这篇文章主要会讲到等等知识点，不知道大家对其都有多少了解，下面我们就一起来看一吧！当然，非常希望大家能多多评论，给出合理的建议，我们一起学习，一起进步！

背景介绍

在当前信息量爆炸的时代，语言模型的训练日益变得复杂和困难。为了培训一个高效的语言模型，我们需要大量的计算资源和时间，这对很多人来说是不切实际的。同时，我们也面临着如何在有限的内存和计算资源下运用大型语言模型的挑战，尤其是在边缘设备上。

今天要给大家推荐一个 GitHub 开源项目 jzhang38/TinyLlama，该项目在 GitHub 有超过 4.3k Star，用一句话介绍该项目就是：“The TinyLlama project is an open endeavor to pretrain a 1.1B Llama model on 3 trillion tokens.”。

只需少量计算和内存资源即可运行的小型 Llama 大模型

项目介绍

TinyLlama的目标是在3万亿个token上预训练一个1.1B Llama模型。通过适当的优化，我们可以在短短90天内使用16个A100-40G GPUs来实现这一目标。该项目采用了与Llama 2完全相同的架构和tokenizer，这意味着TinyLlama可以轻松嵌入并在许多基于Llama的开源项目中使用。此外，TinyLlama非常紧凑，只有1.1B个参数。这种紧凑性使其能够满足许多需要限制计算和内存占用的应用场景。

只需少量计算和内存资源即可运行的小型 Llama 大模型