-
自2017年首次举办以来,CoRL已经成为了机器人学与机器学习交叉领域的全球顶级学术会议之一。CoRL是面向机器人学习研究的单一主题会议,涵盖了机器人学、机器学习和控制等多个主题,包括理论与应用2023年的CoRL大会将于11月6日至9日在美国亚特兰大举行。根据官方数据透露,今年有来自25个国家的199篇论文入选CoRL。热门主题包括操作、强化学习等。虽然相较于AAAI、CVPR等大型AI学术会议,CoRL的规模较小,但随着今年大模型、具身智能、人形机器人等概念的热度上升,值得关注的相关研究也会在CoRL
-
IT之家11月22日消息,据外媒Wareable报道,谷歌日前在美国通过了一项新专利,其中显示未来PixelWatch等智能手表有望作为谷歌AR/VR眼镜的控制器使用。IT之家从谷歌披露专利图中注意到,谷歌将用户的智能手表视为一个控制器,当AR/VR头显检测用户在手表表面上的动作后,头显就会从手表中接收手势数据,并将保存至一个“手势库”,该库将以“不同的方式”解释用户的行为,将相关动作转换为头显内的命令操作。根据专利图显示,当用户在智能手表上绘制“U”形时,头显将自动打开UBER应用程序;或者当用户绘制“
-
据俄罗斯卫星通讯社报道,俄罗斯总统普京在出席“人工智能世界之旅”时,有俄方官员向普京介绍如何使用AI识别虚假照片和视频的方法。俄方官员用来测试的照片有两张,一张是美国登月照片,美国宇航员乘坐着“阿波罗11号”宇宙飞船首次成功登月,他们将美国国旗插入月壤。另一张照片是中国月球车登陆月球,在月球上总共有两辆中国月球车,分别是2013年着陆的“玉兔号”和2019年着陆的“玉兔二号”。通过使用AI分析这两张照片得出了一个结论,美国登月照存在造假问题,而中国月球车登月照是真实的。俄方官员解释称,“AI的神经网络分析
-
IT之家11月26日消息,AI初创公司Runway日前宣布旗下视频生成模型Gen-2上线“运动笔刷”功能,官方称该功能的推出代表了模型可控性迎来一个重要里程碑,用户只需在图片中涂抹一个区域或主体,并为其选择一个方向、添加运动强度,运动笔刷就可以为用户的生成添加受控运动。目前这项功能可免费试用,通常为125秒的免费额度,一次消耗约4秒。同时,该功能支持用户自己提供图片,或者直接使用Runway生成的图片。此外,这次更新还上线了包括卡通、像素、朋克在内的26种视频滤镜,以及导演模式下对镜头的“精准控制”功能。
-
随着创新技术和客户需求的不断发展,电信行业正处于快速发展阶段。预计到2024年,该行业将迎来巨大的进步和转型。本文将详细介绍2024年电信行业的主要趋势,以帮助读者了解行业发展的动态。5G5G的推出正在逐步进行,预计将在2024年得到广泛接受。5G凭借其超高速、超低延迟和超高可靠性的能力,可以实现无人驾驶汽车、智能工厂、虚拟现实等各种创新用例。随着5G的普及,网络切片技术将成为电信领域的先驱,确保比以前更大的灵活性、敏捷性、可扩展性和效率。生成式人工智能(GenAI)生成式人工智能与电信网络的结合正在逐渐
-
1月10日,荣耀MagicOS8.0(魔法OS8.0)正式发布,除了首发荣耀Magic6系列机型外,其他荣耀Magic系列机型也将在本月内进行系统公测。荣耀MagicOS8.0推出了自家的AI新成果,其中包括了荣耀自研的70亿参数的端侧平台级AI大模型“魔法大模型”的实装。荣耀总裁赵明指出,MagicOS8.0是一款双内核驱动的新一代操作系统。传统内核基于设备进行资源计算,而新内核则基于“人”作为关联因子进行计算。魔法大模型融入到底层系统中,在默契对话、专属服务和隐私保护等场景下具有更多优势。此外,多年来
-
大型语言模型是自然语言处理领域的关键技术,在各种任务中表现出强大性能。解码策略是模型生成文本的重要环节之一。本文将详细介绍大型语言模型中的解码策略,并讨论其优缺点。一、解码策略的概述在大型语言模型中,解码策略是生成文本序列的方法。常见的解码策略包括贪心搜索、束搜索和随机搜索。贪心搜索是一种简单直接的方法,每次选择概率最高的词作为下一个词,但可能会忽略其他可能性。束搜索是在贪心搜索的基础上加入了宽度限制,只保留概率最高的几个候选词,从而增加了多样性。随机搜索则是随机选择下一个词,能够产生更多的多样性,但可能
-
FLOPS是计算机性能评估的标准之一,用来衡量每秒的浮点运算次数。在神经网络中,FLOPS常用于评估模型的计算复杂度和计算资源的利用率。它是一个重要的指标,用来衡量计算机的计算能力和效率。神经网络是一种复杂的模型,由多层神经元组成,用于进行数据分类、回归和聚类等任务。训练和推断神经网络需要进行大量的矩阵乘法、卷积等计算操作,因此计算复杂度非常高。FLOPS(FloatingPointOperationsperSecond)可以用来衡量神经网络的计算复杂度,从而评估模型的计算资源使用效率。FLOPS指的是每
-
大型语言模型(LLMs)的进步在很大程度上推动了代码生成领域的发展。此前的研究中,强化学习(RL)与编译器的反馈信号被结合在一起,用于探索LLMs的输出空间,以优化代码生成的质量。但当下还存在两个问题:1.强化学习探索很难直接适配到「复杂的人类需求」,即要求LLMs生成「长序列代码」;2.由于单元测试可能无法覆盖复杂的代码,因此使用未执行的代码片段来优化LLMs是无效的。为了应对这些挑战,研究人员提出了一种名为StepCoder的新型强化学习框架,该框架由复旦大学、华中科技大学和皇家理工学院的专家共同开发
-
随着现代技术和创新的出现,全球供应链正处于发生变革。它们变得越来越复杂,因此需要利用这些技术的力量来有效地管理它们。本文将介绍供应链管理领域的一些主要新兴趋势,这些趋势将提高软件的整体效率。那么在开始之前,先来了解一下,什么是供应链软件?什么是供应链软件?供应链软件或供应链管理软件是一种旨在优化供应链运营多个方面的工具。该软件根据企业的不同提供了一些定制功能,但基本上,都提供了管理供应链核心流程的功能,如采购、库存管理、物流、订单履行和需求预测。这些解决方案利用云计算、大数据分析、人工智能(AI)和物联网
-
工业AI,没有新王,光而无耀,静水深流。要说生成式AI是当下话题之王,没有人会反对。简单几句话,就能让兵马俑「复活」唱秦腔,特朗普说上脱口秀。情绪价值拉满之余,你敢不敢想象更酷的事情,如动动嘴皮子就能造出想要的东西。AI不仅能够生成一段视频,更能构建一个沉浸式、高仿真、遵循物理规律的虚拟空间,只需自然语音输入指令,它就能将其转化为专业的工业语言,再交由现实工厂的智能化产线变成「实物」。敢不敢想象更酷的事情,动动嘴皮子就能造出想要的东西!如此美妙未来或许看似遥远,但在西门子的描绘下,它早已不是空中楼阁,AI
-
近日,快手可灵大模型团队开源了名为LivePortrait的可控人像视频生成框架,该框架能够准确、实时地将驱动视频的表情、姿态迁移到静态或动态人像视频上,生成极具表现力的视频结果。如下动图所示:来自网友测试LivePortrait来自网友测试LivePortrait快手开源的LivePortrait对应的论文题目为:《LivePortrait:EfficientPortraitAnimationwithStitchingandRetargetingControl》LivePortrait论文首页并且,Li
-
1.腾讯全球数字生态大会定档腾讯宣布2024年腾讯全球数字生态大会将于9月5日至6日在深圳国际会展中心举行,主题为“智启新机,云驱增长”。2.焦点:AI等前沿技术助力产业增长腾讯云与智慧产业事业群CEO汤道生表示,大会将探讨AI大模型等前沿技术的新发展,探索数字化助力产业新增长的可行路径。3.大会内容:全方位展示产业数字化大会将全面展示腾讯云的核心产品、解决方案和最佳实践,呈现产业互联网的最新探索和实践方法。4.线下线上同步举行:设置多个板块大会将线下、线上同时举行,包括主峰会、主题专场、技术专题和智能互
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文作者来自于中国科学技术大学,上海人工智能实验室以及香港中文大学。其中第一作者黄启栋为中国科学技术大学三年级博士生,主要研究方向包括多模态大模型(MLLM)和可信/高效AI,师从张卫明
-
编辑|ScienceAI近日,上海交通大学、上海AILab、中国移动等机构的联合研究团队,在arXiv预印平台发布文章《TowardsEvaluatingandBuildingVersatileLargeLanguageModelsforMedicine》,从数据、测评、模型多个角度全面分析讨论了临床医学大语言模型应用。文中所涉及的所有数据和代码、模型均已开源。GitHub:https://github.com/MAGIC-AI4Med/MedS-InsPaperLink:https://arxiv.or