-
23年9月国防科大、京东和北理工的论文“DeepModelFusion:ASurvey”。深度模型融合/合并是一种新兴技术,它将多个深度学习模型的参数或预测合并为一个模型。它结合了不同模型的能力来弥补单个模型的偏差和错误,以获得更好的性能。而大规模深度学习模型(例如LLM和基础模型)上的深度模型融合面临着一些挑战,包括高计算成本、高维参数空间、不同异构模型之间的干扰等。本文将现有的深度模型融合方法分为四类:(1)“模式连接”,通过一条损失减少的路径将权重空间中的解连接起来,以获得更好的模型融合初始化;(2
-
在视觉生成领域迅速发展的进程中,扩散模型已经完全改变了这一领域的发展态势,其引入的文本引导生成功能标志着能力方面的深刻变革。然而,仅依赖文本来调节这些模型并不能完全满足不同应用和场景的多样化和复杂需求。鉴于这种不足,许多研究旨在控制预训练文本到图像(T2I)模型以支持新条件。北京邮电大学的研究人员对T2I扩散模型的可控性生成进行了深入审查,概括了该领域的理论基础和实际进展。这项综述涵盖了最新的研究成果,为该领域的发展和应用提供了重要参考。论文:https://arxiv.org/abs/2403.0427
-
一、引言近年来,人工智能技术取得了举世瞩目的成果,其中,自然语言处理(NLP)和计算机视觉等领域的研究尤为突出。在这些领域,一种名为Transformer的模型逐渐成为研究热点,以其为核心的创新成果层出不穷。本文将从Transformer的原理、应用和产业实践等方面,探讨其如何引领AI技术百花齐放。二、Transformer原理浅析背景知识在介绍Transformer之前,需要了解其背景知识——循环神经网络(RNN)和长短时记忆网络(LSTM)。RNN在处理序列数据时,存在梯度消失和梯度爆炸的问题,这使得
-
2024年WAIC・云帆奖面向全球征选AI青年技术人才,欢迎点击「此链接」报名或提名。人工智能的研究范式和产业格局正在经历深刻而积极的转变。过去一年,大模型引发了一股席卷全球的智能浪潮,这不仅推动了AI技术在更广泛领域的应用,也激发了人类对人工智能深层次潜力的追寻和探索。在这场技术革新的洪流中,通用人工智能(AGI)正逐渐从幻想走进现实。我们正处于一个新征程的起点,这个阶段将以人类对通用智能的不懈追求为特征。迎接即将到来的新时代,让我们将目光投向那些充满激情、勇于探索的青年创新者。他们凭借卓越的智慧和无畏
-
Hellofolks,我是Luga,今天我们来聊一下人工智能(AI)生态领域相关的技术-LLM评估。一、传统文本评估面临的挑战近年来,随着大型语言模型(LLM)的快速发展和改进,传统的文本评估方法在某些方面可能已经不再适用。在文本评估领域,我们可能已经听说过一些方法,例如基于“单词出现”的评估方法,比如BLEU,以及基于“预训练的自然语言处理模型”的评估方法,比如BERTScore。尽管这些方法过去一直表现出色,但随着LLM生态技术的不断发展,它们似乎稍显力不从心,无法完全满足当前的需求。随着LLM技术的
-
大数据对大量信息进行结构化和非结构化信息为特征,为政府提供了从医疗保健和教育到交通和城市规划等公共管理各个方面的前所未有的见解。通过先进的数据分析技术,政府可以识别海量数据集中的趋势、模式和相关性,从而制定基于证据的政策和战略。大数据的迅速增长和复杂性为传统分析方法带来了重大挑战。GenAI算法由机器学习和深度学习技术提供支持,擅长处理和综合大型数据集,提取有价值的见解以及生成预测模型。政府可以利用机器学习算法,通过预测分析来提高治理效率。通过分析历史数据和利用机器学习算法,政府可以预测未来趋势,同时预测
-
18日晚,金州勇士队后卫克莱·汤普森在对阵萨克拉门托国王队的比赛中投篮命中10投0中,导致球队无缘NBA赛后赛。更让球迷哭笑不得的是,马斯克的社交媒体平台X的人工智能助手Grok生成了一条热门新闻,声称汤普森正在用砖块破坏该地区的房屋。姚且关于篮球并不感兴趣,但即使普通观众也能轻易看出这则新闻的虚构之处。然而,Grok仿佛没有那么聪明。它在看到用户大量讨论关于球员“投砖”(shootingbricks,即投篮不中)的帖子后,错误地理解了这一球场术语,生硬套用形成了一篇完全虚构的新闻报道。本网站注意到,这则
-
人工智能在2024年将以五种方式影响硬件设计,从加速头脑风暴过程到提前发现设计缺陷。每个硬件团队的使命都是推动创新,设计出颠覆性产品,并保证按时交付在预算内。然而,由于硬件设计和开发周期长、流程低效以及资源匮乏,这一目标常常受到威胁。尽管其他行业正在迅速采用人工智能技术,但在硬件市场中,人工智能的应用仍处于起步阶段。直到最近,硬件团队才开始对人工智能的潜力表现出浓厚的兴趣。如果能够合理应用,人工智能有望改变这一现状。硬件领域似乎需要更多的时间和资源来适应这一变革。随着技术的不断发展,人工智能在硬件领域的应
-
如果你有被Sora生成的视频震撼到,那你就已经见识过扩散模型在视觉生成方面的巨大潜力。当然,扩散模型的潜力并不止步于此,它在许多其它不同领域也有着让人期待的应用前景,更多案例可参阅本站不久前的报道《爆火Sora背后的技术,一文综述扩散模型的最新发展方向》。最近,由新加坡国立大学的尤洋团队、加州大学伯克利分校以及MetaAIResearch所进行的研究发现了扩散模型的一个新应用:用于生成神经网络的模型参数。论文地址:https://arxiv.org/pdf/2402.13144.pdf项目地址:https
-
托管数据中心通常设计用来容纳数十甚至数百个客户的不同应用程序。不过,英伟达提供了一种独特的数据中心模式,该数据中心专门为单一客户运行特定应用程序。“人工智能工厂”的出现这种新型的数据中心与传统数据中心不同,它专注于提供更高效、更灵活的基础设施服务。传统数据中心往往承载多个应用程序和多个租户,而新型数据中心更注重资源的动态分配和优化,以满足不同应用程序和租户的需求。这种新型数据中心的设计更加灵活和智能,能够根据需求实时调整资源分配,提高整体效率和性能。通过这种创新的设计理念,这些新的数据中心主要用于托管少量
-
在「天工」大模型发布一周年之际,昆仑万维重磅宣布,「天工3.0」基座大模型与「天工SkyMusic」音乐大模型正式开启公测。自从AI让人类实现音乐创作自由后,连吵架都变得有趣了起来。在过去的时候,X平台知名AI博主AranKomatsuzaki自己写了一首歌,专门用来表达对另一位AI科学家—GaryMarcus的不满,还用当前大火的Suno把它生成了出来。要知道,过去,这些大佬们的口水战主要就是发个帖子,然后你来我往地跟帖。这次,AranKomatsuzaki的做法可谓是玩出了新花样,不知道是不是从“谢帝
-
图神经网络(GNNs)善于利用图的结构信息进行推断,但通常需要进行特定领域的调优,以实现最佳性能,这使得它们在不同任务之间的泛化能力受到限制。大型语言模型(LLM)在图推理方面具有更强的跨任务和泛化能力,但通常在特定任务上表现不如专用的图神经网络模型。当前图推理相关研究往往忽略了视觉信息在图推理中的重要性,无论是传统的图神经网络还是基于大型语言模型的图推理方法。然而,人类会通过视觉特征高效和准确地完成图任务,例如判断图中是否存在环。因此,探究视觉形态的图信息在图推理中的作用具有重要意义。更具体地,将图(G
-
心理测量在精神健康、自我了解、和个人发展方面都发挥着重要的作用。传统的心理测量方法主要依赖于参与者填写自我报告问卷,通过回忆日常生活中的行为和情绪来进行测量。这样的测量方式虽然高效便捷,但可能引发参与者的抗拒心理,降低被测意愿。随着大语言模型(LLM)的发展,很多研究发现LLM能够展现出稳定的人格特质,模仿人类细微的情绪与认知模式,还能辅助各种各样的社会科学仿真实验,为教育心理学、社会心理学、文化心理学、临床心理学、心理咨询等诸多心理学研究领域,提供了新的研究思路。近日,清华大学的研究团队基于大语言模型的
-
人工智能(AI)的整合无处不在,为各个行业提供了变革机会。其中一种范式转变是人工智能与边缘计算的融合,促进可持续解决方案和创新应用。企业可以利用人工智能的快速发展使客户体验(CX)和预测分析方面达到大规模的高度个性化转变其服务和业务,以管理业务运作。人工智能、5G和物联网融合5G网络提供的好处是:低延迟设备连接的大幅度增加反过来又允许扩展机器来实现机器通信网络连接设备和传感器的出现导致了大规模的超个性化环境与经济普华永道发布了一份报告,阐述了人工智能帮助减少碳排放的潜力。据其分析,到2030年,应用于农业
-
据内部消息透露,微软斥资约6.5亿美元,与人工智能初创企业Inflection AI达成一项重磅协议。根据该协议,微软不仅将获得Inflection的核心大模型使用权,更将吸纳其大部分员工,包括联合创始人,为微软注入新的活力。据报道,Inflection公司的先进人工智能模型将利用微软的Azure云服务平台对外开放。这一巨额授权费用的到来将有助于Inflection回馈其投资者,包括Greylock和Dragoneer等。预计这些投资者将获得高达1.5倍的丰厚回报作为回馈。周二,微软宣布Inflectio