-
【环球网科技综合报道】11月14日消息,据外媒报道,微软AI助手Copilot现已与PDF文件集成。这意味着用户在Edge上打开PDF文件时,可直接从中访问和使用Copilot的功能,从而提高工作效率。据悉,PDF文件菜单中已添加了“询问Copilot”选项。当用户选择一个单词时,会出现一个带有多个选项的下拉菜单,该菜单中的选项之一是“询问Copilot”。用户单击后将立即打开BingChat,从而得到相应的工作方面的帮助。根据之前的报道,微软最近发布了Windows11PC操作系统的下一个重大更新。作为
-
重写内容:投资要点是在进行投资时需要注意的关键要素1、“设备采购”是人形机器人下阶段的核心指标。人形机器人正处于“研发到小批量生产”的关键阶段,过去的主题炒作模式正逐步失效。跟踪零部件厂商设备采购,是验证小批量试生产阶段何时到来,判断下一轮人形机器人行情的核心指标。本报告通过对生产工艺及设备的梳理,①梳理出设备环节中弹性较大的环节,②挖掘出有希望实现设备国产化的环节并跟踪相应公司进展。2、人形机器人零部件介绍:目前暂定的特斯拉人形机器人方案包括28个执行器,滚柱丝杠、谐波减速器及空心杯电机的价值量较高,且
-
熵量化了事件的不确定性大小。在数据科学中,交叉熵和KL散度与离散概率分布相关,用于衡量两个分布的相似程度。在机器学习中,通过交叉熵损失来评估预测分布与真实分布的接近程度。给定真实分布t和预测分布p,它们之间的交叉熵由以下等式给出:其中p(x)是真实概率分布(one-hot),q(x)是预测概率分布。然而,在现实世界中,预测值与实际值的差异称为发散,因为它们背离了实际值。交叉熵是熵和KL散度的综合度量。现在让我们使用分类示例了解交叉熵如何适合深度神经网络范例。每个分类案例都有一个已知的类别标签,概率为1.0
-
联邦学习使用多个参与方可以在数据隐私得到保护的情况下训练模型。但是由于服务器无法监控参与者在本地进行的训练过程,参与者可以篡改本地训练模型,从而对联邦学习的整体模型构成安全隐患,如后门攻击。本文重点关注如何在有防御保护的训练框架下,对联邦学习发起后门攻击。本文发现后门攻击的植入与部分神经网络层的相关性更高,并将这些层称为后门攻击关键层。在联邦学习中,参与训练的客户端分布在不同的设备上,它们各自训练自己的模型,然后将更新的模型参数上传至服务器进行聚合。由于参与训练的客户端不可信,存在一定风险,因此服务器基于
-
Grok-1官宣开源不过半月,新升级的Grok-1.5出炉了。刚刚,马斯克xAI官宣,128K上下文Grok-1.5,推理能力大幅提升。并且,很快就会上线。11天前,Grok-1模型的权重和架构开源,展示了Xai在去年11月之前取得的进展。Grok-1有3140亿参数,是Llama2的4倍大,而且采用的是MoE架构,8个专家中2个是活跃专家。Xai介绍,也就是从那时起,团队改进了最新模型Grok-1.5的推理和解决问题的能力。OpenAI前开发者关系负责人表示,从xAI重大发布的时间可以看出他们前进的步伐
-
近年来,随着大模型技术的迅速发展,模型能力的上限不断被挑战。然而从产业变革的角度看,大模型的落地或许处于起步阶段。如何才能发挥出大模型的巨大潜力,并推动生产力更快更好地变革,仍是一个充满探索空间的课题。每个行业都关心一个问题:将大模型应用到业务层面的最优方法论是什么?当我们谈及这个问题,自然无法避开「AIAgent」(智能体)。AI在从学术研究跨越到实际应用时,大模型驱动的智能体正成为推动革新的核心动力。连比尔盖茨也预言,AIAgent将是人工智能的未来。到那时,AIAgent将具备规划、执行、感知、记忆
-
MLP(多层感知器)用了几十年了,真的没有别的选择了吗?多层感知器(MLP),也被称为全连接前馈神经网络,是当今深度学习模型的基础构建块。MLP的重要性无论怎样强调都不为过,因为它们是机器学习中用于逼近非线性函数的默认方法。然而,MLP是否就是我们能够构建的最佳非线性回归器呢?尽管MLP被广泛使用,但它们存在明显的缺陷。例如,在Transformer模型中,MLP几乎消耗了所有非嵌入式参数,并且通常在没有后处理分析工具的情况下,相对于注意力层来说,它们的可解释性较差。所以,是否有一种MLP的替代选择?今天
-
编辑|KX蛋白质的动力学对于理解其机制至关重要。然而,通过计算预测蛋白质动学信息具有挑战性。在此,来自山东大学、百图生科(BioMap)、北京理工大学、湖北医药学院、宁夏医科大学和阿卜杜拉国王科技大学(KAUST)的研究团队,提出了一个神经网络模型RMSF-net,其优于以前的方法,并在大规模蛋白质动力学数据集中产生最佳结果;该模型可以在几秒钟内准确推断出蛋白质的动力学信息。通过从实验蛋白质结构数据和低温电子显微镜(cryo-EM)数据集成中有效地学习,该方法能够准确识别低温电子显微镜图和PDB模型之间的
-
只用1890美元、3700万张图像,就能训练一个还不错的扩散模型。现阶段,视觉生成模型擅长创建逼真的视觉内容,然而从头开始训练这些模型的成本和工作量仍然很高。比如StableDiffusion2.1花费了200000个A100GPU小时。即使研究者使用最先进的方法,也需要在8×H100GPU上训练一个多月的时间。此外,训练大模型也对数据集提出了挑战,这些数据基本以亿为单位,同样给训练模型带来挑战。高昂的训练成本和对数据集的要求为大规模扩散模型的开发造成了难以逾越的障碍。现在,来自SonyAI等
-
尽管收集人类对模型生成内容的相对质量的标签,并通过强化学习从人类反馈(RLHF)来微调无监督大语言模型,使其符合这些偏好的方法极大地推动了对话式人工智能的发展。但由于RLHF是一个复杂且常常不稳定的过程,关于直接使用优化函数将人类的偏好和模型的结果进行对齐的研究成为时下的热点问题。本文是huggingface上的一篇博客,针对时下常见的三种人类偏好优化算法进行了性能比较。作者进行了大量的实验,旨在通过不同的模型和不同的超参数,对无需强化学习(或偏好调整)就能调整语言模型的三种可行方法进行评估。这三种优化方
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本篇综述工作已被《IEEE模式分析与机器智能汇刊》(IEEETPAMI)接收,作者来自三个团队:香港大学俞益洲教授与博士生陈超奇、周洪宇,香港中文大学(深圳)韩晓光教授与博士生吴毓双、许
-
现在,大语言模型的结构化生成有了一个更加高效、灵活的引擎。不管是编写和调试代码,还是通过函数调用来使用外部工具,又或是控制机器人,都免不了需要LLM生成结构化数据,也就是遵循某个特定格式(如JSON、SQL等)的数据。但使用上下文无关语法(CFG)来进行约束解码的方法并不高效。针对这个困难,陈天奇团队提出了一种新的解决方案:XGrammar。XGrammar是一个开源软件库,可实现高效、灵活且可移植的结构化生成。该团队在博客中表示:「我们毫不妥协地实现了这三个目标,并致力于一个核心使命:将灵活、零开销的结
-
博通、迈威尔(Marvell)与超微等国际半导体大厂,近来力拱矽光子及共同封装光学元件(CPO)应用,台积电(2330)及日月光(3711)投控带头组联盟抢进;法人预期,相关商机2026年可望放大,看好台积电、日月光投控、颖崴(6515)、致茂(2360)、波若威(3163)、稳懋(3105)等指标厂率先受惠。法人分析,2024年见到矽光相关收发器需求成长,随网通大厂力推与技术演进,2026年后有助整体产业规模突破。国际半导体产业协会(SEMI)预估2030年全球矽光子半导体市场规模将达到78.6亿美元,
-
高效路由:中国科学院前瞻实验室突破路由验证与查找性能瓶颈网络规模和流量的爆炸式增长,以及大范围路由异常事件的频发,给路由查找和验证带来了巨大的性能挑战。中国科学院计算机网络信息中心前瞻实验室团队针对这一难题,取得了突破性进展,三项研究成果相继被计算机网络领域顶级期刊和会议录用。针对BGP路由验证的低效问题,该团队创新性地提出了授权前缀验证模型,克服了现有块验证模型的性能瓶颈。基于此模型,他们设计了高性能路由起源验证算法h2ROV,该算法利用树比特位图技术,显著提升了验证速度并降低了存储开销,为未来RPKI
-
北京昂瑞微电子技术股份有限公司近日公布一项名为“用于数据信号处理的方法和电路”的新专利(申请公布号:CN119051673A),申请公布日为2024年11月29日。该专利公开了一种创新的数据信号处理方法及电路。其核心在于根据信道频点信息,动态调整时钟源,从而优化数据信号的模数转换采样和数字基带信号处理。具体而言,该方法首先获取传输数据信号的信道频点信息,并据此确定信道的频点类别。如果频点类别属于第一类别,则采用第一时钟源进行数据信号的模数转换采样和数字基带信号处理;反之,若频点类别属于第二类别,则利用混频