-
用来运行Llama3405B优势明显。最近,Meta开源了最新的405B模型(Llama3.1405B),把开源模型的性能拉到了新高度。由于模型参数量很大,很多开发者都关心一个问题:怎么提高模型的推理速度?时隔才两天,LMSYSOrg团队就出手了,推出了全新的SGLangRuntimev0.2。这是一个用于LLM和VLM的通用服务引擎。在运行Llama3.1405B时,它的吞吐量和延迟表现都优于vLLM和TensorRT-LLM。在某些情况下(运行Llama系列模型),它的吞吐量甚至能达到TensorRT
-
KAN在符号表示中领先,但MLP仍是多面手。多层感知器(Multi-LayerPerceptrons,MLP),也被称为全连接前馈神经网络,是当今深度学习模型的基本组成部分。MLP的重要性无论怎样强调都不为过,因为它是机器学习中用于逼近非线性函数的默认方法。然而,MLP也存在某些局限性,例如难以解释学习到的表示,以及难以灵活地扩展网络规模。KAN(Kolmogorov–ArnoldNetworks)的出现,为传统MLP提供了一种创新的替代方案。该方法在准确性和可解释性方面优于MLP,而且,它能
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文第一作者皮仁杰是香港科技大学三年级博士生,师从张潼教授和周晓方教授。此前获得香港大学计算机工程学士学位。研究兴趣为多模态大语言模型,以数据为中心的人工智能,以及自动化机器学习。随着大
-
开源多模态大模型或将开始腾飞。值此Llama3.1占领各大头条之际,又突然冒出了另一个也非常重要的发布——一个规模空前的开源多模态数据集。对大模型来说,数据集的重要性无需多言,甚至可以说没有大型数据集就不可能有大模型。现在正是多模态大模型(LMM)发展正盛的时候,规模足够大的优质且开源的多模态数据集已经成为该领域的一大「刚需」。不过,相比于开源的文本数据集,现有的开源多模态数据集都比较小、多样性也不足,并且来源基本都是HTML文档——这就限制了数据的广度和多
-
编辑|萝卜皮理解蛋白质功能并开发分子疗法,需要确定蛋白质发挥作用的细胞类型,并解析蛋白质之间的相互作用。然而,对跨生物背景的蛋白质相互作用进行建模,对于现有的算法而言仍然具有挑战性。在最新的研究中,哈佛医学院的研究人员开发了PINNACLE,这是一种生成情境感知蛋白质表征的几何深度学习方法。PINNACLE利用多器官单细胞图谱,在情境化蛋白质相互作用网络上进行学习,从24种组织的156种细胞类型情境中生成了394,760种蛋白质表征。该研究以「ContextualAImodelsforsingle-cel
-
2024年东京奥运会即将开幕。7月26日,智能AI助手豆包宣布携手跳水奥运冠军吴敏霞、羽毛球奥运冠军林丹、体育解说员黄健翔及体育解说员刘语熙共同打造专属奥运智能体,用户可以在豆包App中和他们畅聊奥运话题。同时,豆包网页版也将上线“AI带你解读奥运”专区,为用户提供奥运新闻早晚报、赛事回放、AI解说等内容。明星智能体据介绍,上述明星智能体不仅在对话语气上模拟了几人的性格特征,同时也获得了声音授权。用户可以随时在豆包中体验与这些专业人士交流奥运赛事的乐趣:黄健翔:共同探讨足球比赛的战术布局和精彩进球林丹:讲
-
在现代制造业中,精准的缺陷检测不仅是保证产品质量的关键,更是提升生产效率的核心。然而,现有的缺陷检测数据集常常缺乏实际应用所需的精确度和语义丰富性,导致模型无法识别具体的缺陷类别或位置。为了解决这一难题,由香港科技大学广州和思谋科技组成的顶尖研究团队,创新性地开发出了“DefectSpectrum”数据集,为工业缺陷提供了详尽、语义丰富的大规模标注。如表一所示,相比其他工业数据集,“DefectSpectrum”数据集提供了最多的缺陷标注(5438张缺陷样本),最细致的缺陷分类(125种缺陷类别),并为不
-
7月25日,备受期待的《永劫无间》手游正式开启公测,该手游预下载阶段便荣登AppStore免费总榜TOP1!游戏中全新引入的语音AI队友功能,迅速吸引了广大玩家的关注和好评。1.网易首创AICopilot队友这一创新玩法由网易24工作室联合网易伏羲AI实验室共同研发,作为全球首款游戏Copilot队友,该功能依托于最前沿的AI大模型推理技术,成功塑造了与真人玩家体验相媲美的AI队友。功能亮点AI队友不仅能够自主执行跑图、搜索物资、参与战斗、跑圈等战术动作,更能在战斗中提供辅助和救援,通过自然语音与玩
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com具身智能是实现通用人工智能的必经之路,其核心是通过智能体与数字空间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com具身智能是实现通用人工智能的必经之路,其核心是通过智能体与数字空间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。
-
对于AI来说,奥数不再是问题了。本周四,谷歌DeepMind的人工智能完成了一项壮举:用AI做出了今年国际数学奥林匹克竞赛IMO的真题,并且距拿金牌仅一步之遥。上周刚刚结束的IMO竞赛共有六道赛题,涉及代数、组合学、几何和数论。谷歌提出的混合AI系统做对了四道,获得28分,达到了银牌水平。本月初,UCLA终身教授陶哲轩刚刚宣传了百万美元奖金的AI数学奥林匹克竞赛(AIMO进步奖),没想到7月还没过,AI的做题水平就进步到了这种水平。IMO上同步做题,做对了最难题IMO是历史最悠久、规模最大、最负盛名的青年
-
智谱大模型团队自研打造。自从快手可灵AI火爆海内外,国内视频生成也如同2023年的文本大模型一样,越来越卷了。刚刚,又一视频生成大模型产品宣布正式上线:智谱AI正式发布「清影」。只要你有好的创意(几个字到几百个字),再加上一点点耐心(30秒),「清影」就能生成1440x960清晰度的高精度视频。即日起,清影上线清言App,所有用户都可以全方位体验对话、图片、视频、代码和Agent生成功能。除了覆盖智谱清言的网页端和App,你也可以在「AI动态照片小程序」上进行操作,快速为手机里的照片实现动态效果。智谱「清
-
开放LLM社区正是百花齐放、竞相争鸣的时代,你能看到Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1等许多表现优良的模型。但是,相比于以GPT-4-Turbo为代表的专有大模型,开放模型在很多领域依然还有明显差距。在通用模型之外,也有一些专精关键领域的开放模型已被开发出来,比如用于编程和数学的DeepSeek-Coder-V2、用于视觉-语言任务的InternVL1.5(其
-
近日,国际计算机图形与交互技术顶会(TheACMSpecialInterestGrouponComputerGraphics,简称SIGGRAPH)公布论文接收结果:网易伏羲最新研究成果《PreconditionedNonlinearConjugateGradientMethodforReal-timeInterior-pointHyperelasticity》成功入选。8月,团队成员将赴美国科罗拉多州丹佛市,在SIGGRAPH2024大会上亲述报告,与全世界计算机图形爱好
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本论文第一作者杜超群是清华大学自动化系2020级直博生。导师为黄高副教授。此前于清华大学物理系获理学学士学位。研究兴趣为不同数据分布上的模型泛化和鲁棒性研究,如长尾学习,半监督学习,迁移