如何使用一个 API 创建 AI 聊天机器人来访问多个 LLM
来源:dev.to
时间:2024-08-24 10:25:00 438浏览 收藏
积累知识,胜过积蓄金银!毕竟在文章开发的过程中,会遇到各种各样的问题,往往都是一些细节知识点还没有掌握好而导致的,因此基础知识点的积累是很重要的。下面本文《如何使用一个 API 创建 AI 聊天机器人来访问多个 LLM》,就带大家讲解一下知识点,若是你对本文感兴趣,或者是想搞懂其中某个知识点,就请你继续往下看吧~
最初由 liz acosta 发表在 streamlit 博客上
还记得第一次使用人工智能图像生成器有多酷吗?那两千万根手指和噩梦般的吃意大利面的画面不仅仅是有趣,它们在不经意间透露了哎呀!人工智能模型的智能程度与我们一样。和我们一样,他们也很难画手。
人工智能模型很快变得更加复杂,但现在的模型数量太多了。而且,和我们一样,他们中的一些人比其他人更擅长某些任务。以文本生成为例。尽管 llama、gemma 和 mistral 都是法学硕士,但他们中的一些人更擅长生成代码,而另一些人则更擅长头脑风暴、编码或创意写作。根据提示,它们提供不同的优势,因此在您的 ai 应用程序中包含多个模型可能是有意义的。
但是如何将所有这些模型集成到你的应用程序中而不需要重复代码?如何使人工智能的使用更加模块化,从而更易于维护和扩展?这就是 api 可以提供用于跨不同技术进行通信的标准化指令集的地方。
在这篇博文中,我们将了解如何使用 replicate 和 streamlit 来创建一个应用程序,该应用程序允许您通过单个 api 调用来配置和提示不同的 llm。别担心——当我说“应用程序”时,我并不是说必须启动整个 flask 服务器或繁琐地配置你的路由或担心 css。 streamlit 已经为您解决了这个问题 ?
继续阅读以学习:
- 什么是复制
- streamlit 是什么
- 如何构建演示复制聊天机器人 streamlit 应用程序
- 以及使用 replicate 的最佳实践
不想读书?以下是探索此演示的一些其他方法:
- 在此处的 streamlit cookbook 存储库中查找代码
- 在此处尝试应用程序的部署版本
- 在此处观看 replicate 创始设计师 zeke sikelianos 的视频演练
什么是复制?
replicate 是一个平台,使开发人员能够通过 cli、api 或 sdk 部署、微调和访问开源 ai 模型。该平台可以轻松地以编程方式将人工智能功能集成到软件应用程序中。
replicate 上的可用模型
- 文本:像 llama 3 这样的模型可以根据输入提示生成连贯且上下文相关的文本。
- 图像:像稳定扩散这样的模型可以根据文本提示生成高质量的图像。
- 语音:像 whisper 这样的模型可以将语音转换为文本,而像 xtts-v2 这样的模型可以生成听起来自然的语音。
- 视频:像 animate-diff 这样的模型或像 videocrafter 这样的稳定扩散的变体可以分别根据文本和图像提示生成和/或编辑视频。
当一起使用时,replicate 允许您开发多模式应用程序,这些应用程序可以接受输入并生成各种格式的输出,无论是文本、图像、语音还是视频。
什么是 streamlit?
streamlit 是一个开源 python 框架,只需几行代码即可构建高度交互的应用程序。 streamlit 与生成式 ai 中的所有最新工具集成,例如任何 llm、矢量数据库或各种 ai 框架(如 langchain、llamaindex 或 weights & biases)。 streamlit 的聊天元素使与 ai 交互变得特别容易,因此您可以构建“与您的数据对话”的聊天机器人。
与 replicate 这样的平台相结合,streamlit 允许您创建生成式 ai 应用程序,而无需任何应用程序设计开销。
? 要了解有关 streamlit 如何让您取得进步的更多信息,请查看这篇博文。
要了解有关 streamlit 的更多信息,请查看 101 指南。
尝试应用程序配方:复制 + streamlit
但不要相信我的话。亲自尝试该应用程序或观看视频演示,看看您的想法。
在此演示中,您将使用 replicate 启动 streamlit 聊天机器人应用程序。该应用程序使用单个 api 来访问三个不同的 llm 并调整温度和 top-p 等参数。这些参数影响人工智能生成文本的随机性和多样性,以及选择标记的方法。
? 什么是模型温度? 温度控制模型如何选择令牌。较低的温度使模型更加保守,有利于常见和“安全”的词语。相反,较高的温度会鼓励模型通过选择可能性较小的令牌来承担更多风险,从而产生更多创意输出。
? 什么是top-p? 也称为“核采样”——是另一种调整随机性的方法。随着 top-p 值的增加,它的工作原理是考虑更广泛的代币集。较高的 top-p 值会导致采样的代币范围更加多样化,从而产生更加多样化的输出。
先决条件
- python 版本 >=3.8, !=3.9.7
- 复制 api 密钥 (请注意,需要使用付款方式才能访问超出免费试用限制的功能。)
? 要了解有关 api 密钥的更多信息,请查看此处的博客文章。
环境设置
本地设置
- 克隆 cookbook 存储库:git clone https://github.com/streamlit/cookbook.git
- 从cookbook根目录,将目录更改为复制配方:cdrecipes/replicate
- 将您的复制 api 密钥添加到 .streamlit/secrets_template.toml 文件中
- 将文件名从secrets_template.toml更新为secrets.toml: mv .streamlit/secrets_template.toml .streamlit/secrets.toml (要了解有关 streamlit 中秘密处理的更多信息,请参阅此处的文档。)
- 创建虚拟环境:python -m venvreplicatevenv
- 激活虚拟环境:sourcereplicatevenv/bin/activate
- 安装依赖项:pip install -rrequirements.txt
github codespaces 设置
-
从 github 上的 cookbook 存储库,通过从“代码”按钮中选择“代码空间”选项来创建一个新的代码空间
生成代码空间后,将您的 replicate api 密钥添加到recipe/replicate/.streamlit/secrets_template.toml 文件中
将文件名从secrets_template.toml更新为secrets.toml
(要了解有关 streamlit 中秘密处理的更多信息,请参阅此处的文档。)从cookbook根目录,将目录更改为复制食谱:cdrecipes/replicate
安装依赖项:pip install -rrequirements.txt
使用 replicate 运行文本生成模型
- 在recipes/replicate目录中创建一个名为replicate_hello_world.py的文件
-
将以下代码添加到文件中:
import replicate import toml import os # read the secrets from the secrets.toml file with open(".streamlit/secrets.toml", "r") as f: secrets = toml.load(f) # create an environment variable for the replicate api token os.environ['replicate_api_token'] = secrets["replicate_api_token"] # run a model for event in replicate.stream("meta/meta-llama-3-8b", input={"prompt": "what is streamlit?"},): print(str(event), end="")
运行脚本:pythonreplicate_hello_world.py
您应该会看到模型生成的文本的打印结果。
要了解有关复制模型及其工作原理的更多信息,您可以在此处参考其文档。从本质上讲,复制“模型”是指经过训练、打包和发布的软件程序,它接受输入并返回输出。
在这种特殊情况下,模型是meta/meta-llama-3-8b,输入是“提示”:“什么是streamlit?”。当您运行脚本时,将调用 replicate 端点,打印的文本是模型通过 replicate 返回的输出。
运行演示 replicate streamlit 聊天机器人应用程序
要运行演示应用程序,请使用 streamlit cli:streamlit run streamlit_app.py。
运行此命令会将应用程序部署到本地主机上的端口。当您访问此位置时,您应该会看到 streamlit 应用程序正在运行。
您可以使用此应用程序通过复制提示不同的llm,并根据您提供的配置生成生成文本。
适用于多个 llm 模型的通用 api
使用 replicate 意味着您可以使用一个 api 提示多个开源 llm,这有助于简化 ai 与现代软件流程的集成。
这是通过以下代码块完成的:
for event in replicate.stream(model, input={"prompt": prompt_str, "prompt_template": r"{prompt}", "temperature": temperature, "top_p": top_p,}): yield str(event)
模型、温度和 top p 配置由用户通过 streamlit 的输入小部件提供。 streamlit 的聊天元素可以轻松地将聊天机器人功能集成到您的应用程序中。最好的部分是您不需要了解 javascript 或 css 来实现和设计这些组件 - streamlit 提供了所有开箱即用的功能。
复制最佳实践
使用提示的最佳模型
replicate 提供了一个 api 端点来搜索公共模型。您还可以在他们的网站上探索特色模型和用例。这可以让您轻松找到适合您特定需求的型号。
不同的型号有不同的性能特点。根据您对准确性和速度的需求使用适当的模型。
使用 webhooks、流媒体和图像 url 提高性能
replicate 的输出数据仅可用一个小时。使用 webhook 将数据保存到您自己的存储中。您还可以设置 webhooks 来处理来自模型的异步响应。这对于构建可扩展的应用程序至关重要。
尽可能利用流媒体。某些模型支持流式传输,允许您在生成部分结果时获得它们。这非常适合实时应用程序。
与使用 base 64 编码的上传图像相比,使用图像 url 可以提高性能。
使用 streamlit 释放 ai 的潜力
借助 streamlit,数月的应用程序设计工作简化为 只需几行 python 代码。它是展示最新人工智能发明的完美框架。
使用 streamlit cookbook 中的其他 ai 食谱快速启动并运行 快速。 (别忘了在论坛中向我们展示您正在构建的内容!)
祝 streamlit 快乐! ?
终于介绍完啦!小伙伴们,这篇关于《如何使用一个 API 创建 AI 聊天机器人来访问多个 LLM》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布文章相关知识,快来关注吧!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
267 收藏
-
229 收藏
-
420 收藏
-
234 收藏
-
372 收藏
-
477 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 507次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习