-
在奖励中减去平均奖励在当今的大模型时代,以RLHF为代表的强化学习方法具有无可替代的重要性,甚至成为了OpenAIο1等模型实现强大推理能力的关键。但这些强化学习方法仍有改进空间。近日,强化学习之父、阿尔伯塔大学教授RichardSutton的团队低调更新了一篇论文,其中提出了一种新的通用思想RewardCentering,并称该思想适用于几乎所有强化学习算法。这里我们将其译为「奖励聚中」。该论文是首届强化学习会议(RLC2024)的入选论文之一。一作AbhishekNaik刚刚从阿尔伯塔
-
1.10月9日,铭普光磁发布公告称,公司近日取得一项中国国家知识产权局颁发的发明专利证书,发明名称“一种绕线设备”,专利号ZL201910927264.4。2.该发明属于变压器生产加工技术领域,涉及一种绕线设备,包括机箱、绕线机构、移送上下料机构、焊接机构和切线机构。移送上下料机构包括上料装置、移送组件和下料装置,其中上料装置和下料装置并排设置于机箱一侧,移送组件与上料装置和下料装置相应设置。焊接机构和切线机构相对于机箱设置在另一侧,绕线机构设置在焊接机构和切线机构之间的让位处。这种布局使绕线设备各个机构
-
编辑|ScienceAI由上海人工智能实验室提出的VirSci(VirtualScientists)系统是一个基于大语言模型(LLM)的多智能体协作平台,专注于模拟科学家团队的合作过程,从而加速科研创新。不同于以往的单智能体系统,VirSci通过使用真实科学家的数据来模拟科学团队的多人协作,不仅可以通过团队成员的合作讨论来生成更具创新性和影响力的科研想法,还展现出作为「科学学」(ScienceofScience)研究工具的巨大潜力。该研究以「TwoHeadsAreBetterThanOne:AMulti-
-
1.10月8日,小鹏汽车宣布,小鹏P7+将于10月10日全球首秀,宣传语为“因AI而生,越级登场”。新车预计四季度上市,将成为“全球首款AI汽车”。在9月举行的2024云栖大会上,小鹏汽车董事长何小鹏驾驶全新车型小鹏P7+亮相。小鹏P7+定位为全球首款AI汽车,具备自主学习能力,采用端到端大模型与视觉系感知方案,支持100%无图智驾。提供180kW和230kW两种动力版本,续航里程为575km-710km。
-
10月17日,由工业和信息化部、交通运输部、北京市人民政府联合主办的“2024世界智能网联汽车大会”在北京开幕。小米董事长兼首席执行官雷军在论坛上发表演讲时呼吁,产业界要相互团结,良性竞争。雷军指出,汽车行业是一个百年赛道,目前正处于与消费电子工业融合的关键变革期,未来5年是改变格局的最佳时机。在这样的时刻,在面临挑战的时刻,更应该团结,加强协作,良性竞争,共同进步。汽车产业市场非常大,大家完全有机会携手开展全球汽车产业。此外,雷军还强调,车企要坚持科技创新,力争成为全球技术和品质标杆。雷军表示,小米汽车
-
人工智能领域再度迎来重磅消息!2023年8月,通义首次开源后迅速引起全球开发者的关注和热议,短短一年时间内,阿里云大模型又迎来了重要升级。在9月19日的云栖大会上,CTO周靖人宣布:通义千问发布新一代开源模型Qwen2.5,开源旗舰模型Qwen2.5-72B性能超越Llama3.1-405B,再次登上全球开源大模型的王座;通义旗舰模型Qwen-Max全方位升级,性能已经逼近GPT-4o。发布现场,图源:泽南通义千问凭借不断迭代的技术和丰富的应用场景,迅速崛起为开发者的热门选择,尤其是在中文社区中引发了广泛
-
1.商务部回应中欧贸易救济争端2.欧盟对中国白兰地反倾销措施提出申诉中国商务部新闻发言人表示,中国对欧盟白兰地采取的反倾销措施是根据国内产业申请依法发起的正当贸易救济措施,完全符合世贸组织规则。3.中国对欧盟电动汽车反补贴措施提起诉讼商务部新闻发言人指出,欧盟对中国电动汽车进行的反补贴调查并非应产业申请,且严重缺乏事实和法律基础,违反世贸组织规则。中国已在世贸组织提出强烈交涉,并提起争端解决机制。4.中国反对滥用贸易救济措施中国一贯反对滥用贸易救济措施,敦促欧盟纠正错误做法,共同维护中欧经贸大局。
-
1.10月16日,鹏辉能源宣布,为优化产能分配并提升市场影响力,将在驻马店市正阳县投资10亿元,新建日产3万支小动力方形铝壳锂离子电池和日产50万支电容式锂离子电池项目。2.鹏辉能源将在正阳县成立全资或控股子公司作为项目执行主体。项目资金将通过股债结合的方式筹集,包括银行贷款、发行可转债、优先股、配股和非公开发行股份等。具体融资方式和计划尚未确定,尚未签署相关协议。3.鹏辉能源表示,此投资符合其发展战略,旨在优化产能布局、增强市场影响力和竞争力,满足未来业务拓展需求。该项目将对公司产业布局和发展产生积极且
-
子曾经曰过:「见贤思齐焉,见不贤而内自省也。」自省可以帮助我们更好地认识自身和反思世界,对AI来说也同样如此吗?近日,一个多机构联合团队证实了这一点。他们的研究表明,语言模型可以通过内省来了解自身。论文标题:LookingInward:LanguageModelsCanLearnAboutThemselvesbyIntrospection论文地址:https://arxiv.org/pdf/2410.13787让LLM学会自省(introspection)其实是一件利害皆有的事情。好的方面讲,自省式模型可
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本篇论文已被NeurIPS2024接收,论文第一作者郑传阳来自香港中文大学,共同作者包括新加波国立大学高伊杭,诺亚实验室石涵、任晓哲、蒋欣、李震国,香港中文大学黄敏斌、李靖瑶,香港大学熊
-
从现在开始,努力学习吧!本文《CNCC | 倒计时4天!CCF-网易雷火联合基金研讨会:议程嘉宾交通参会指南一图掌握》主要讲解了等等相关知识点,我会在golang学习网中持续更新相关的系列文章,
-
编辑|KX分子对接是一种预测配体结合姿势的技术,在基于结构的药物设计中对于理解蛋白质-配体相互作用至关重要。最近,几何深度学习(GDL)对接方法,比传统采样方法具有更高的效率和准确性。然而,当前的方法通常是针对特定的对接设置量身定制的,并且会忽略蛋白质侧链结构,难以处理大型结合口袋,难以预测物理有效结构。为此,中国科学技术大学和北京大学的研究团队,提出了一种新颖的两阶段对接框架DeltaDock,包括口袋预测和位点特异性对接。研究人员创新地将口袋预测任务重新定义为口袋-配体对齐问题,而不是在第一阶段直接预
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com多年来,浙江大学周晟老师团队与阿里安全交互内容安全团队持续开展产学研合作。近日,双⽅针对标签噪声下图神经⽹络的联合研究成果《NoisyGL:标签噪声下图神经网络的综合基准》被NeurIP
-
1.日月光半导体(ASE)在高雄建立了新的K28工厂,以扩大其先进封装业务。2.K28工厂的奠基仪式于10月9日举行,预计在2026年竣工,将提高ASE的先进封装产能并创造约900个就业机会。3.高雄厂区总经理RaymondLo表示,K27和K28工厂位于大沙,面积为2公顷,用于满足CoWoS技术的晶圆和最终测试需求。4.K27工厂已于2023年投入运营,而K28工厂是日月光与宏璟合作建设的,位于日月光自有土地上。5.K28综合体将包括七层地上建筑和一层地下建筑,采用低碳建筑材料,配备节能设备,并安装太阳
-
提示工程是一种在机器学习模型,尤其是预训练语言模型中,通过精心设计输入提示(prompt)来引导模型输出期望结果的技术。在大语言模型的使用中,提示词通常是一段文本,用来引导模型生成特定的输出或完成特定的任务。在多文档搜索、问答系统、文档自动摘要生成以及阅读理解等多样化且复杂的应用场景中,往往会面临输入提示(prompt)长度显著增加的挑战。这种超长prompt不仅加大了大型语言模型(LLM)的推理成本,还显著延长了推理时间,从而严重限制了其在需要即时响应的实时应用场景中的适用性。为了克服这一难题,优化pr