-
今天凌晨,OpenAI突然宣布终止对中国提供API服务,进一步收紧国内开发者访问GPT等高水平大模型。国内开发者真是太难了。好在,随着开源大模型水平越来越高,开发者已经有很多不错的“平替”,比如Qwen2、DeepSeekV2等模型。为了给开发者提供更快、更便宜、更全面、体验更丝滑的开源大模型API,AIInfra领域的专业选手硅基流动(SiliconFlow)上场,推出了一站式大模型API平台SiliconCloud。刚刚,硅基流动为国内开发者献上一份前所未有的大礼:Qwen2(
-
GenAI仍然是大多数企业的首要投资重点,而且期望值很高。根据普华永道的最新调查,美国61%的CEO预期AI将改变他们的业务价值生成方式,但要实现这一目标,企业必须将AI的炒作转化为现实。好消息是,他们在这方面越来越擅长。事实上,根据Databricks最近发布的《数据+AI状态报告》的结果,企业将1342%的模型从实验阶段推向了现实世界,而且他们对数据和AI的雄心并没有减弱,实验模型的数量也增长了134%。这些都是令人鼓舞的迹象,但根据我与CIO和其他技术领导者的对话,当前的挑战是如何保持这一势头。公司
-
当前的多模态和多任务基础模型,如**4M**或**UnifiedIO**,显示出有希望的结果。然而,它们接受不同输入和执行不同任务的开箱即用能力,受到它们接受训练的模态和任务的数量(通常很少)的限制。,基于此,来自洛桑联邦理工学院(EPFL)和苹果的研究者联合开发了一个**先进的**任意到任意模态单一模型,该模型在数十种**广泛**多样化的模态上进行训练,并对大规模多模态数据集和文本语料库进行协同训练。训练过程中一个关键步骤是对各种模态执行离散**tokenization**,无论它们是类似图像的神经网络
-
作者|康奈尔大学杜沅岂编辑|ScienceAI随着AIforScience受到越来越多的关注,人们更加关心AI如何解决一系列科学问题并且可以被成功借鉴到其他相近的领域。AI与小分子药物发现是其中一个非常有代表性和很早被探索的领域。分子发现是一个非常困难的组合优化问题(由于分子结构的离散性)并且搜索空间非常庞大与崎岖,同时验证搜索到的分子属性又十分困难,通常需要昂贵的实验,至少是至少是模拟计算、量子化学的方法来提供反馈。随着机器学习的高速发展和得益于早期的探索(包括构建了简单可用的优化目标与效果衡量方法),
-
作者|康奈尔大学杜沅岂编辑|ScienceAI随着AIforScience受到越来越多的关注,人们更加关心AI如何解决一系列科学问题并且可以被成功借鉴到其他相近的领域。AI与小分子药物发现是其中一个非常有代表性和很早被探索的领域。分子发现是一个非常困难的组合优化问题(由于分子结构的离散性)并且搜索空间非常庞大与崎岖,同时验证搜索到的分子属性又十分困难,通常需要昂贵的实验,至少是至少是模拟计算、量子化学的方法来提供反馈。随着机器学习的高速发展和得益于早期的探索(包括构建了简单可用的优化目标与效果衡量方法),
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com上海交通大学生成式人工智能实验室(GAIRLab)的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公
-
或许从诞生那天起,LangChain就注定是一个口碑两极分化的产品。看好LangChain的人欣赏它丰富的工具和组建和易于集成等特点,不看好LangChain的人,认为它注定失败——在这个技术变化如此之快的年代,用LangChain来构建一切根本行不通。夸张点的还有:「在我的咨询工作中,我花了70%的精力来说服人们不要使用langchain或llamaindex。这解决了他们90%的问题。」最近,一篇LangChain吐槽文再次成为热议焦点:作者FabianBoth是AI测试工具O
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com在人工智能领域的发展过程中,对大语言模型(LLM)的控制与指导始终是核心挑战之一,旨在确保这些模型既强大又安全地服务于人类社会。早期的努力集中于通过人类反馈的强化学习方法(RLHF)来管
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com在生成式模型的迅速发展中,ImageTokenization扮演着一个很重要的角色,例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizer
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com该文章的第一作者安照崇,目前在哥本哈根大学攻读博士学位,导师为SergeBelongie。他硕士毕业于苏黎世联邦理工学院(ETHZurich),在硕士期间,他在导师LucVanGool的
-
华为开发者大会2024在东莞召开。在大会现场,华为发布了HarmonyOSNext、盘古大模型5.0等方面的最新进展,并介绍了一系列AI先进技术的应用案例。华为云CTO张宇昕表示:“华为云基于盘古大模型的能力,重塑一系列的云服务,打造AINative的云,助力千行万业智能化。”据介绍,华为云将盘古大模型和华为在产品研发、数据治理、安全防护、业务运维等各个领域积累的数据和经验相结合,“跳了自己的降落伞”,应用在了华为云CodeArts、DataArts、MetaStudio和GaussDB、云安全等系列云服