首页 > 文章 > python教程

用有限的资源微调 LLAMA 或文本分类

来源：dev.to

时间：2024-07-20 16:18:55 380浏览收藏

本篇文章向大家介绍《用有限的资源微调 LLAMA 或文本分类》，主要包括，具有一定的参考价值，需要的朋友可以参考一下。

我最近需要对工作中的特定用例进行句子分类。记得 jeremy howard 的第 4 课：针对绝对初学者的 nlp 入门，我首先改编了他的笔记本来微调 deberta。

它有效，但并不令我满意，所以我很好奇如果我使用像 llama 3 这样的 llm 会发生什么。问题是什么？ gpu 资源有限。我只能访问 tesla/nvidia t4 实例。

研究让我找到了 qlora。这个关于使用 qlora 微调 llama 3 llm 进行股票情绪文本分类的教程特别有用。为了更好地理解本教程，我将第 4 课改编成 qlora 教程笔记本。

qlora 使用两种主要技术：

量化：降低模型精度，使其更小。
lora（低阶适应）：添加小型可训练层，而不是微调整个模型。

这使我能够在 16gb vram t4 上训练 llama 3 8b，使用大约 12gb 的 vram。结果出奇的好，预测准确率超过90%。

Confusion Matrix:
[[83  4]
[ 4  9]]
Classification Report:
              precision    recall  f1-score   support
         0.0       0.95      0.95      0.95        87
         1.0       0.69      0.69      0.69        13
    accuracy                           0.92       100
   macro avg       0.82      0.82      0.82       100
weighted avg       0.92      0.92      0.92       100
Balanced Accuracy Score: 0.8231653404067196
Accuracy Score: 0.92

这是详细介绍该过程的 ipython 笔记本。

这种方法表明可以在有限的硬件上使用大型语言模型。在限制条件下工作通常会带来创造性的问题解决和学习机会。在这种情况下，这些限制促使我去探索和实施更高效的微调技术。

理论要掌握，实操不能落！以上关于《用有限的资源微调 LLAMA 或文本分类》的详细介绍，大家都掌握了吧！如果想要继续提升自己的能力，那么就来关注golang学习网公众号吧！

声明：本文转载于：dev.to 如有侵犯，请联系study_golang@163.com删除

最新阅读

更多>

文章 · python教程 | 3小时前 |

Python实现Word2Vec词向量教程

403 收藏
文章 · python教程 | 3小时前 |

Python调试技巧：pdb使用教程

148 收藏
文章 · python教程 | 3小时前 |

PySpark判断列是否包含指定列表值

266 收藏
文章 · python教程 | 3小时前 | Python 结构变异基因测序数据 pysam 读段

Python解析基因测序结构变异检测方法

323 收藏
文章 · python教程 | 4小时前 | Python 函数模运算符位运算符奇偶判断

Python判断奇偶数的函数写法很简单，可以通过取模运算来实现。以下是一个基本的示例：defis_even(n):returnn%2==0#示例用法num=4ifis_even(num):print(f"{num}是偶数")else:print(f"{num}是奇数")解释：n%2==0：如果n除以2的余数为0，则说明是偶数。函数返回一个布尔值（True或False），可以根据需要进行扩展。扩展版

283 收藏
文章 · python教程 | 4小时前 |

Python中assign添加列方法详解

190 收藏
文章 · python教程 | 4小时前 | Python API gspread GoogleSheets 服务账号

Python操作GoogleSheets：gspread库教程

395 收藏
文章 · python教程 | 4小时前 | 命令行兼容性 Python版本官方文档文档查询

查看Python版本及文档查询方法

290 收藏
文章 · python教程 | 4小时前 |

Python中eval的作用与使用详解

229 收藏
文章 · python教程 | 4小时前 | Python OCR 数据处理 tabula-py PDF表格提取

Python用tabula-py提取PDF表格教程

392 收藏
文章 · python教程 | 4小时前 |

Python处理PDF技巧：PyPDF2功能详解

229 收藏
文章 · python教程 | 4小时前 |

Python中mod用法及取模运算详解

396 收藏

课程推荐

更多>

前端进阶之JavaScript设计模式

设计模式是开发人员在软件开发过程中面临一般问题时的解决方案，代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景，打造一站式知识长龙服务，适合有JS基础的同学学习。

立即学习 542次学习
GO语言核心编程课程

本课程采用真实案例，全面具体可落地，从理论到实践，一步一步将GO核心编程技术、编程思想、底层实现融会贯通，使学习者贴近时代脉搏，做IT互联网时代的弄潮儿。

立即学习 511次学习
简单聊聊mysql8与网络通信

如有问题加微信：Le-studyg；在课程中，我们将首先介绍MySQL8的新特性，包括性能优化、安全增强、新数据类型等，帮助学生快速熟悉MySQL8的最新功能。接着，我们将深入解析MySQL的网络通信机制，包括协议、连接管理、数据传输等，让

立即学习 498次学习
JavaScript正则表达式基础与实战

在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。

立即学习 487次学习
从零制作响应式网站—Grid布局

本系列教程将展示从零制作一个假想的网络科技公司官网，分为导航，轮播，关于我们，成功案例，服务流程，团队介绍，数据部分，公司动态，底部信息等内容区块。网站整体采用CSSGrid布局，支持响应式，有流畅过渡和展现动画。

立即学习 484次学习