-
无论是语速超快、发音复杂的绕口令,还是精妙绝伦的文言文,又或是充满即兴和灵感的随意聊天,模型都能流畅自然地给出准确而地道的翻译结果。近年来,人工智能(AritificialIntelligence,AI),尤其是以大语言模型(LargeLanguageModels,LLMs)为代表的AI正以惊人的速度发展,这些模型在多种自然语言处理任务中展现了卓越的能力。然而,尽管在许多领域取得了突破,代表着人类顶尖语言水平的同声传译(SimultaneousInterpretation,SI)依然是一个未被完全攻克的难
-
AI竞赛正以前所未有的速度加速,继Meta昨天推出其新的开源Llama3.1模型之后,法国AI初创公司MistralAI也加入了竞争。刚刚,MistralAI宣布其旗舰开源模型的下一代产品:MistralLarge2,该模型拥有1230亿个参数,在代码生成、数学、推理等方面与OpenAI和Meta的最新尖端模型不相上下。紧随Llama3.1405B之后,MistralLarge2的发布让开源大模型的赛道一下子热闹起来,而这一模型的特点是——「足够大」。具体来说,虽然MistralL
-
我们知道LLM是在大规模计算机集群上使用海量数据训练得到的,本站曾介绍过不少用于辅助和改进LLM训练流程的方法和技术。而今天,我们要分享的是一篇深入技术底层的文章,介绍如何将一堆连操作系统也没有的「裸机」变成用于训练LLM的计算机集群。这篇文章来自于AI初创公司Imbue,该公司致力于通过理解机器的思维方式来实现通用智能。当然,将一堆连操作系统也没有的「裸机」变成用于训练LLM的计算机集群并不是一个轻松的过程,充满了探索和试错,但Imbue最终成功训练了一个700亿参数的LLM,并在此过程中积累了许多有用
-
7月24日,快手视频生成大模型可灵AI宣布基础模型再次升级,并全面开放内测。快手表示,为了让更多用户能使用可灵AI,更好满足创作者不同层次的使用需求,即日起,在全面开放内测的基础上,还将正式上线会员体系,针对不同类别的会员,提供相应的专属功能服务。同时,可灵AI的基础模型也再次迎来升级,进一步提升用户体验。基础模型效果再升级进一步提升用户体验发布一个多月以来,可灵AI已经多次升级迭代,随着本次会员体系的推出,可灵AI的基础模型效果再次迎来蜕变。首先是画面质量显著提升,通过升级后的基础模型生成的视频,其画面
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本工作由清华大学朱军教授领衔的基础理论创新团队发起。长期以来,团队着眼于目前人工智能发展的瓶颈问题,探索原创性人工智能理论和关键技术,在智能算法的对抗安全理论和方法研究中处于国际领先水平
-
经历了提前两天的「意外泄露」之后,Llama3.1终于在昨夜由官方正式发布了。Llama3.1将上下文长度扩展到了128K,拥有8B、70B和405B三个版本,再次以一已之力抬高了大模型赛道的竞争标准。对AI社区来说,Llama3.1405B最重要的意义是刷新了开源基础模型的能力上限,Meta官方称,在一系列任务中,其性能可与最好的闭源模型相媲美。下表展示了当前Llama3系列模型在关键基准测试上的性能。可以看出,405B模型的性能与GPT-4o十分接近。与此同时,Meta公布了《TheLlama3Her
-
刚刚,大家期待已久的Llama3.1官方正式发布了!Meta官方发出了「开源引领新时代」的声音。在官方博客中,Meta表示:「直到今天,开源大语言模型在功能和性能方面大多落后于封闭模型。现在,我们正在迎来一个开源引领的新时代。我们公开发布MetaLlama3.1405B,我们认为这是世界上最大、功能最强大的开源基础模型。迄今为止,所有Llama版本的总下载量已超过3亿次,我们才刚刚开始。」Meta创始人、CEO扎克伯格也亲自写了篇长文《OpenSourceAIIsthePathForward》,阐述为什么
-
编辑|萝卜皮静电电容器是国防、航空、能源和交通领域先进电力系统中的关键储能元件。能量密度是静电电容器的品质因数,主要由介电材料的选择决定。大多数工业级聚合物介电材料都是柔性聚烯烃或刚性芳族化合物,具有高能量密度或高热稳定性,但不能同时具有这两种特性。在这里,佐治亚理工学院(GeorgiaInstituteofTechnology)、康涅狄格大学(UniversityofConnecticut)以及清华大学的研究团队利用人工智能(AI)、聚合物化学和分子工程,来发现聚降冰片烯和聚酰亚胺系列中的一系列电介质。
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com近年,短视频生态的赛道迅猛崛起,围绕短视频而生的创作编辑工具在不断涌现,美图公司旗下专业手机视频编辑工具——Wink,凭借独创的视频画质修复能力独占鳌头,海内外用
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com近年,短视频生态的赛道迅猛崛起,围绕短视频而生的创作编辑工具在不断涌现,美图公司旗下专业手机视频编辑工具——Wink,凭借独创的视频画质修复能力独占鳌头,海内外用
-
当前,采用下一token预测范式的自回归大型语言模型已经风靡全球,同时互联网上的大量合成图像和视频也早已让我们见识到了扩散模型的强大之处。近日,MITCSAIL的一个研究团队(一作为MIT在读博士陈博远)成功地将全序列扩散模型与下一token模型的强大能力统合到了一起,提出了一种训练和采样范式:DiffusionForcing(DF)。论文标题:DiffusionForcing:Next-tokenPredictionMeetsFull-SequenceDiffusion论文地址:https://arxi
-
这是人类首次证明神经网络可以创建自己的地图。想象一下,你身处一个陌生的小镇,即使一开始周围的环境并不熟悉,你也可以四处探索,并最终在大脑中绘制出一张环境地图,里面包含建筑物、街道、标志等相互之间的位置关系。这种在大脑中构建空间地图的能力是人类更高级认知类型的基础:例如,有理论认为,语言是由大脑中类似地图的结构编码的。然而,即使是最先进的人工智能和神经网络,也无法凭空构建这样的地图。计算生物学助理教授、HeritageMedical研究所研究员MattThomson说:「有一种感觉是,即使是最先进的人工智能
-
快准备好你的GPU!Llama3.1终于现身了,不过出处却不是Meta官方。今日,Reddit上新版Llama大模型泄露的消息遭到了疯传,除了基础模型,还包括8B、70B和最大参数的405B的基准测试结果。下图为Llama3.1各版本与OpenAIGPT-4o、Llama38B/70B的比较结果。可以看到,即使是70B的版本,也在多项基准上超过了GPT-4o。图源:https://x.com/mattshumer_/status/1815444612414087294显然,3.1版本的8B和70B模型是由
-
近期,小米集团投资的首个具身智能企业“小雨智造”,与行业巨头松下的合资公司唐山松下达成重大战略合作,旨在共同开发先进的大模型智能焊接机器人。7月18日,唐山松下产业机器人有限公司(下称“唐山松下”)与北京小雨智造科技有限公司(下称“小雨智造”)的战略合作签约仪式在唐山松下总部圆满完成。松下产业机器有限公司总经理桥山祐一郎、执行副总经理柳铮,小雨智造创始人兼CEO乔忠良、联合创始人兼副总裁李川等领导共同出席了签约仪式,双方均对本次合作寄
-
机器之能报道编辑:Sia工牌也能疯。还记得篇篇10万+的打工人「发疯」文案么?喜欢各种爆改的年轻人,最近又开辟了「工位精装修」新赛道。作为打工人每天停留最长甚至是「唯二」停留的地方,爆改可以提供「情绪价值。」除了置办各种潮玩和手办,爆改工位文案也成了新热点。赵钱孙李、周吴郑王、都能将姓氏融入谐音梗,打造充满「疯感」的自我介绍。不是你死就是我「王」,吓唬谁呢!我真的会「谢」……加班加到半「叶」?「李」行你上啊!还真对得上。技高一筹的文案更是融大IP于无形!「崔啊崔啊」「我的骄傲放