-
强化学习(RL)是一种机器学习方法,它允许代理通过试错来学习如何在环境中表现。行为主体会因为采取行动导致预期结果而获得奖励或受到惩罚。随着时间的推移,代理会学会采取行动,以使得其预期回报最大化RL代理通常使用马尔可夫决策过程(MDP)进行训练,MDP是为顺序决策问题建模的数学框架。MDP由四个部分组成:状态:环境的可能状态的集合。动作:代理可以采取的一组动作。转换函数:在给定当前状态和动作的情况下,预测转换到新状态的概率的函数。奖励函数:为每次转换分配奖励给代理的函数。代理的目标是学习策略函数,将状态映射
-
运营商财经网消息11月11日上午,中国电信集团有限公司江苏分公司副总经理肖江浩在5G新应用合作论坛上,分享了江苏电信围绕5G增强通话AI视频客服所做的一些应用探索及实践尝试。根据他的介绍,江苏电信的5G增强通话是在现有的语音通道基础上添加了新的数据通道,可以传输图像、视频等丰富的多媒体信息对于公众客户而言,能够让用户在正常的通信过程中添加背景或头像,包括添加手势、同步翻译等个性化的效果,可以极大地增加整个通话的趣味性。政府和企业客户都能够通过这种全新的超清晰智能交互增强通话能力,提高营销服务中的沟通效率,
-
近日,AI大佬,现任ZoomCTO的黄学东,在自家的官网上发表了一篇博客。其中隆重介绍了自己加入Zoom六个月之后创新的成果——ZoomAICompanion,以及驱动ZoomAICompanion的Zoom联邦(federatedapproach)AI。在Zoom之前,黄学东曾担任微软AzureAI首席技术官,他不仅是微软首位全球华人技术院士,也是微软最高级别的华人科学家。黄学东在微软任职了超过30年,在他的牵线搭桥下,微软于1998年在北京建起第一个亚洲研究院。黄学东在2017年和2020年分别当选为
-
仅靠视觉(像素)模型能走多远?UC伯克利、约翰霍普金斯大学的新论文探讨了这一问题,并展示了大型视觉模型(LVM)在多种CV任务上的应用潜力。最近一段时间以来,GPT和LLaMA等大型语言模型(LLM)已经风靡全球。构建大型视觉模型(LVM)是一个备受关注的问题,我们需要什么来实现它呢?LLaVA等视觉语言模型所提供的思路很有趣,也值得探索,但根据动物界的规律,我们已经知道视觉能力和语言能力二者并不相关。比如许多实验都表明,非人类灵长类动物的视觉世界与人类的视觉世界非常相似,尽管它们和人类的语言体系「两模两
-
基于LiDAR点云点3DObjectDetection一哥是一个很经典的问题,学术界和工业界都提出了各种各样的模型来提高精度、速度和鲁棒性。但因为室外的复杂环境,所以室外点云的ObjectDetection的性能都还不是太好。而激光雷达点云本质上比较稀疏,如何针对性得解决这一问题呢?论文给出了自己的答案:依照时序信息的聚合来完成信息的提取。写在前面这篇论文主要探讨了自动驾驶面临的一个重要挑战:如何精确地建立周围环境的三维表示。这对于确保自动驾驶汽车的可靠性和安全性至关重要。特别是,自动驾驶车辆需要能够识别
-
麻省理工学院和微软进行了联合研究,发现不需要额外的训练即可提升大型语言模型的任务性能,并减小其大小在大型模型时代,Transformer以其独特的能力支撑起整个科研领域。自推出以来,基于Transformer的语言模型(LLM)在各种任务中展现出卓越的性能。Transformer的底层架构已成为自然语言建模和推理的最先进技术,并在计算机视觉和强化学习等领域展现出强大的前景然而,当前Transformer架构非常庞大,通常需要大量计算资源来进行训练和推理。这样重写:这样做是有意义的,因为经过更多参数或数据训
-
微软版Sora诞生了!Sora虽爆火但闭源,给学术界带来了不小的挑战。学者们只能尝试使用逆向工程来对Sora复现或扩展。尽管提出了DiffusionTransformer和空间patch策略,但想要达到Sora的性能还是很难,何况还缺乏算力和数据集。不过,研究者发起的新一波复现Sora的冲锋,这不就来了么!就在刚刚,理海大学联手微软团队一种新型的多AI智能体框架———Mora。论文地址:https://arxiv.org/abs/2403.13248没错,理海大学和微软的思路,是靠AI智能体。Mora更像
-
国产机器人新突破:两只各自独立的机械臂,已经可以丝滑地打配合了!不信你看这双手拧瓶盖:拧完再端起杯子倒水:活灵活现,如真人。呐,还能搭把手帮程序员安装好显示屏:甚至接过“同事”手里的大箱子:可以说是各种几何和物理特性的物体都能稳稳hold住。(下一步还能干啥,不敢想)这就是腾讯RoboticsX实验室的最新成果:通用双臂协同灵巧操作框架。目前已登上机器人领域顶刊《IEEETransactionsonRobotics》。既然是干活,抗干扰能力得有:既然是双手干活,两胳膊就不能“搅”一起:下面这个不明觉厉的“
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文作者来自香港大学和腾讯。作者列表:李沁桐,LeyangCui,赵学亮,孔令鹏,WeiBi。其中,第一作者李沁桐是香港大学自然语言处理实验室的博士生,研究方向涉及自然语言生成和文本推理
-
:1.最新数据显示,今年1-9月,支持科技创新和制造业发展的减税降费和退税总额为20868亿元。其中,支持科技投入、成果转让和人才培养的减税降费和退税达8937亿元。2.广东惠州的胜宏科技作为当地龙头企业,2024年上半年营收增长32.29%,得益于1.36亿元的研发费用加计扣除和1200多万元的高新技术企业税收优惠。3.近年来,为支持科技创新,研发费用加计扣除比例已提高至100%,并为集成电路和工业母机企业进一步提高至120%。4.截至8月底,我国规模以上工业企业数量达50.4万家,高新技术企业达46.
-
碧桂园出售长鑫科技1.56%股权,套现20亿元用于保交楼碧桂园集团于12月27日晚间发布公告,宣布出售其持有的长鑫科技约1.56%的股权,交易金额达20亿元。长鑫科技是存储器制造商长鑫存储的母公司,碧桂园此前曾参与其B轮和C轮融资。此次交易完成后,碧桂园将完全退出长鑫科技。买方是一家主要从事私募基金业务的有限合伙企业,其最终受益人为合肥市人民政府国有资产监督管理委员会。碧桂园表示,出售股权是为了积极化解阶段性流动压力,并将所得款项用于一般营运资金,主要用于保障房屋交付和项目建设。根据公告,碧桂园持有的长鑫
-
近日,有消息指出哪吒汽车已完成约60亿元融资,具体币种尚未公开。公司内部人士确认,此前存在的薪资问题已得到解决,目前薪资发放正常。虽然有传闻称国有资本和宁德时代参与了此次融资,但官方尚未对此进行回应。据悉,哪吒汽车内部调整基本完成,当前主要目标是确保公司运营稳定,以及车辆生产和售后零部件供应的正常进行。关于直营店关闭的报道,哪吒汽车员工表示与媒体报道基本一致。公司正对渠道体系进行调整,计划取消直营店模式,转为经销商模式。因此,市场上出现哪吒汽车面临困境甚至倒闭的猜测。去年11月,哪吒汽车曾面临大规
-
基于探索驱动的大模型对齐方法COPO:赋予LLM探索能力,突破性能边界AIxiv专栏持续报道全球顶尖AI研究成果。如果您有优秀的研究成果,欢迎投稿至liyazhou@jiqizhixin.com或zhaoyunfeng@jiqizhixin.com。自然界生物的探索精神驱动着进化,人类亦是如此。在人工智能领域,尤其大型语言模型(LLM)的研究中,赋予LLM类似的探索能力,是突破其现有能力边界,提升性能和安全性的关键。中国电信人工智能研究院(TeleAI)院长李学龙教授团队,联合清华大学、香
-
小鹏汽车董事长何小鹏近日发布内部信,展望未来十年AI对汽车行业的深远影响,并对小鹏汽车的2025年发展规划进行了阐述。他指出,2025-2027年将是中国汽车行业竞争最激烈的三年,这既是挑战也是机遇。小鹏汽车计划2025年密集推出新车及改款车型,包括一款全新超级电动版车型,几乎每个季度都有新品发布。何小鹏特别提到国内AI公司DeepSeek的突破性进展,其产品体验媲美OpenAI,成本却大幅降低,这将深刻改变未来十年汽车及全球软硬件领域。在人才战略方面,小鹏汽车将启动“千将计划”储备关键岗位干部,并
-
加州大学伯克利分校吴梓阳博士及其团队提出了一种新型Transformer架构——TokenStatisticsTransformer(ToST),其核心是线性时间复杂度的注意力机制。这项研究成果已发表在ICLR2025,并被选为Spotlight论文。马毅教授将在今年四月ICLR大会上进行主题报告。ToST巧妙地解决了传统Transformer架构中自注意力机制计算复杂度高的问题。传统自注意力机制的计算复杂度随输入token数量呈二次方增长,而ToST通过对序列特征的统计建模,将时间复杂度降低