-
10月12日,2023上海国际消费电子技术展览会(简称“TechG2023”)在上海新国际博览中心开幕。在当天的开幕式论坛上演讲时,联想集团副总裁、中国区首席市场官王传东表示,在第四次工业革命浪潮下,人工智能(AI)正在成为智慧生活中不可或缺的核心元素。在这个新时代,AI的应用和发展呈现出五大特征,深刻地影响着我们的生活、工作和娱乐方式。首先,超凡算力即取即用。随着计算技术的进步,人工智能能够随时随地提供强大的计算能力,满足各种复杂任务的需求。无论是个人电脑还是移动设备,人工智能都能迅速响应,为用户提供前
-
央视网消息:10月12日上午,2023世界航海装备大会在福建福州开幕。作为本次大会的重要组成部分,新时代10年成果展同期亮相,一大批“大国重器”集中亮相。走进大国重器展区,我们可以看到“深海一号”能源站、“爱达·魔都”号大型邮轮、“奋斗者”号深海载人潜水器、“雪龙2号”极地破冰科考船等国之重器的模型。其中,“深海一号”能源站是全球首座十万吨级深水半潜式生产储油平台,标志着中国海洋石油全面掌握超深水油气开发技术,并具备自主建造能力。在建造过程中,创造了3项世界首创技术和13项国内首创技术在“深海一号”能源站
-
全球领先的智能机器人独角兽企业思灵机器人宣布完成对机器人公司FrankaEmika收购。FrankaEmika成立于2016年,是一家位于慕尼黑专注机器人尖端技术研发的公司,曾作为登上德国《时代》杂志封面的50个创新项目之一,并获得了德国未来奖和创新奖。此前,慕尼黑地方法院于2023年8月25日下令对FrankaEmika进行初步破产管理。目前思灵机器人对FrankaEmika的收购已被FrankaEmika的债权人委员会批准,交易双方均表示对具体条款保密。在此次收购完成后,思灵机器人将持续支持Frank
-
11月7日消息,当地时间周一,埃隆・马斯克(ElonMusk)旗下人工智能初创公司xAI宣布推出PromptIDE工具,需要使用X账户登录。跟其他IDE工具类似,PromptIDE是一个用于提示工程和可解释性研究的集成开发环境。它通过SDK加速提示工程,该SDK允许实现复杂的提示技术和丰富的分析功能,从而实现网络输出可视化。IT之家提醒,IDE的核心是一个Python代码编辑器,它可以与新的SDK结合实现复杂的提示。在IDE中执行提示时,用户会看到一些有用的分析和建议,例如精确标记化等等。xAI官方表示,
-
斯坦福大学的最新研究或许能够实现通过意念来控制人工智能机器人科幻正在逐步地接近现实,最近斯坦福大学公开了其最新研发的NOIR模型,这成为了一个备受瞩目的技术突破这一通用型模型通过解码大脑信号,实现了人类通过思维来操控机器人的目标。NOIR的开发为我们展示了一个令人难以置信的未来,其中人们可以通过想象的动作来实现对机器人的控制。为了解码大脑信号,研究人员选择使用脑电图(EEG)。然而,由于复杂的行为涉及选择物体、决定如何拾取、决定如何处理以及最终执行动作等方面,EEG的解码相对困难。NOIR模型针对这个问题
-
Attention机制是一种关键的序列数据处理算法,其主要目标是为序列中的每个元素分配权重,以便在计算输出时考虑它们的相对重要性。这种机制在自然语言处理、图像处理和其他领域都得到了广泛应用。接下来,我将简要介绍几种基于Attention机制的算法及其应用。1.Seq2Seq模型Seq2Seq模型是一种常用的机器翻译模型,使用encoder-decoder架构实现源语言句子到目标语言句子的转换。在该模型中,encoder将源语言句子编码为一个向量,而decoder则利用该向量生成目标语言句子。为了指导dec
-
建立会做视频的世界模型,也能通过Transformer来实现了!来自清华和极佳科技的研究人员联手,推出了全新的视频生成通用世界模型——WorldDreamer。它可以完成多种视频生成任务,包括自然场景和自动驾驶场景,如文生视频、图生视频、视频编辑、动作序列生视频等。据团队介绍,通过预测Token的方式来建立通用场景世界模型,WorldDreamer是业界首个。它把视频生成转换为一个序列预测任务,可以对物理世界的变化和运动规律进行充分地学习。可视化实验已经证明,WorldDreamer已经深刻理解了通用世界
-
昨晚Meta发布了Llama38B和70B模型,Llama3指令调整模型针对对话/聊天用例进行了微调和优化,在常见基准测试中优于许多现有的开源聊天模型。比如,Gemma7B和Mistral7B。Llama+3模型对数据和规模进行了提升,达到了新的高度。它是在Meta最近发布的两个定制的24KGPU集群上,对超过15Ttoken的数据进行训练的。这个训练数据集比Llama2大7倍,包含多4倍的代码。这使得Llama模型的能力达到了目前的最高水平,它支持8K以上的文本长度,是Llama2的两倍。下面我将介绍6
-
在AI领域,扩展定律(Scalinglaws)是理解LM扩展趋势的强大工具,其为广大研究者提供了一个准则,该定律在理解语言模型的性能如何随规模变化提供了一个重要指导。但不幸的是,扩展分析在许多基准测试和后训练研究中并不常见,因为大多数研究人员没有计算资源来从头开始构建扩展法则,并且开放模型的训练尺度太少,无法进行可靠的扩展预测。来自斯坦福大学、多伦多大学等机构的研究者提出了一种替代观察法:可观察的扩展定律(ObservationalScalingLaws),其将语言模型(LM)的功能与跨多个模型系列的下游
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本论文第一作者杜超群是清华大学自动化系2020级直博生。导师为黄高副教授。此前于清华大学物理系获理学学士学位。研究兴趣为不同数据分布上的模型泛化和鲁棒性研究,如长尾学习,半监督学习,迁移
-
LLM很强,而为了实现LLM的可持续扩展,有必要找到并实现能提升其效率的方法,混合专家(MoE)就是这类方法的一大重要成员。最近,各家科技公司提出的新一代大模型不约而同地正在使用混合专家(MixtureofExperts:MoE)方法。混合专家这一概念最早诞生于1991年的论文《Adaptivemixturesoflocalexperts》,三十多年来已经得到了广泛的探索和发展。近年来,随着稀疏门控MoE的出现和发展,尤其是与基于Transformer的大型语言模型相结合,这种已有三十多年历史的技术焕发出
-
1.上周,特斯拉在自动驾驶出租车发布会上展示了其Optimus人形机器人。Optimus在现场展现了智能性,包括跳舞、倒饮料和与与会者互动。然而,随后多家媒体证实,发布会上的Optimus机器人实际上是由特斯拉工程师远程操控的。这一消息引发了一些分析师和投资者的质疑,他们认为特斯拉的展示“不诚实”且具有误导性。尽管如此,英伟达Omniverse开发平台和仿真部门副总裁莱巴雷迪安认为,特斯拉Optimus值得赞扬,而不是批评。“我不确定有多少是远程操控的,但我必须说,即使是远程操控,以那种精确度控制机器人也
-
编辑|KX9月23日,IBM与NASA合作发布了一个用于天气和气候的新型通用AI模型PrithviWxC,该模型可以在台式计算机上运行,且开源。PrithviWxC具有23亿参数,使用MERRA-2数据集的160个变量开发而成。PrithviWxC采用创新的Transformer架构。研究人员在一系列具有挑战性的下游任务上测试了该模型,即:自回归滚动预测、降尺度、重力波通量参数化和极端事件估计。由于其独特的设计和训练机制,PrithviWxC可以解决比现有天气AI模型更多的应用,潜在的应用包括根据当地天气
-
据最新消息,本田和日产正就潜在的合并进行商讨,旨在整合资源,应对日益激烈的全球电动汽车市场竞争。本田官方回应称,三家公司(本田、日产、三菱)正在探讨多种合作模式,目前尚未达成任何最终决定。日产汽车目前正经历第三次经营危机,已裁员9000人并进行高管调整。为应对产能过剩,日产计划到2025年3月底前,将美国产量较去年同期减少17%,影响其在密西西比州和田纳西州的工厂。报道指出,日产正寻求稳定的战略投资者,本田作为其电动汽车领域的合作伙伴,成为潜在候选。本田则计划大幅削减在中国市场的燃油车产能,约减少三分之一
-
在2024年理想AITalk上,理想汽车CEO李想就人工智能等前沿科技进行了深入解读。他指出,电动化和智能化是汽车产业的两大核心驱动力,而真正的智能化,离不开人工智能技术的赋能。李想透露,理想汽车每年投入百亿研发资金,其中一半用于人工智能领域的研发投入。他认为,大模型的崛起将深刻改变人类社会,互联网实现了信息平等,而人工智能将推动认知和知识的平等。他预测,汽车将从传统的交通工具,进化为人工智能时代下的智能空间。关于理想汽车的未来,李想表示,公司的目标是打造理想之家,而非进军Robotaxi领域。他相信,L