-
长上下文大模型帮助机器人理解世界。最近,谷歌DeepMind突然开始炫起了机器人。这个机器人可以轻松听从人类指令、进行视觉导览,用常识推理在三维空间中寻找路径。它使用的是最近谷歌发布的大模型Gemini1.5Pro。在使用传统AI模型时,机器人常因上下文长度限制而难以回忆起环境细节,但Gemini1.5Pro的百万级token上下文长度为机器人提供了强大的环境记忆能力。在真实的办公室场景中,工程师引导机器人游览特定区域,并标出了需要回忆的关键地点,例如「刘易斯的办公桌」或「临时办公桌区域」。转完一圈后,别
-
你想喝瓶啤酒,于是就把桌子叫了过来。这不是吃了菌子才有的场景,而是国外网友的一项发明,名叫Carpentopod。整个桌子有12条腿,里面内置了电机,是木工、电子和编程结合的产物。只要按下遥控器,桌子就会向你走来,像一个家用机器人一样。从图上可以看出,Carpentopod走起来非常平稳,这是它的腿部参数不断「进化」的结果。这个「进化」过程在软件的虚拟环境中进行,数千个虚拟腿部变体在该环境中竞争,只有得分高的腿部变体才能混合「基因」。如此精巧的结构制作起来自然是非常不易。作者表示,「早在2008年,我就写
-
没工作也要「卷」。闲不下来的AndrejKarpathy又有了新项目!过去几天,OpenAI非常热闹,先有AI大牛AndrejKarpathy官宣离职,后有视频生成模型Sora撼动AI圈。在宣布离开OpenAI之后,Karpathy发推表示「这周可以歇一歇了。」图源:https://twitter.com/karpathy/status/1757986972512239665这种无事要做的状态让马斯克都羡慕(Iamenvious)了。但是,如果你真的认为Karpathy会闲下来,那就有点「tooyoung
-
作者|康奈尔大学杜沅岂编辑|ScienceAI随着AIforScience受到越来越多的关注,人们更加关心AI如何解决一系列科学问题并且可以被成功借鉴到其他相近的领域。AI与小分子药物发现是其中一个非常有代表性和很早被探索的领域。分子发现是一个非常困难的组合优化问题(由于分子结构的离散性)并且搜索空间非常庞大与崎岖,同时验证搜索到的分子属性又十分困难,通常需要昂贵的实验,至少是至少是模拟计算、量子化学的方法来提供反馈。随着机器学习的高速发展和得益于早期的探索(包括构建了简单可用的优化目标与效果衡量方法),
-
7月25日,备受期待的《永劫无间》手游正式开启公测,该手游预下载阶段便荣登AppStore免费总榜TOP1!游戏中全新引入的语音AI队友功能,迅速吸引了广大玩家的关注和好评。1.网易首创AICopilot队友这一创新玩法由网易24工作室联合网易伏羲AI实验室共同研发,作为全球首款游戏Copilot队友,该功能依托于最前沿的AI大模型推理技术,成功塑造了与真人玩家体验相媲美的AI队友。功能亮点AI队友不仅能够自主执行跑图、搜索物资、参与战斗、跑圈等战术动作,更能在战斗中提供辅助和救援,通过自然语音与玩
-
本周学术界瞩目的焦点,无疑是在泰国曼谷举行的ACL2024顶会。这场盛会吸引了全球众多杰出的研究者,大家汇聚一堂,共同探讨和分享最新学术成果。官方公布的数据显示,本届ACL共收到近5000篇论文投稿,其中940篇被主会录用,168篇工作入选大会口头报告(Oral),录取率低于3.4%,这当中,字节跳动共有5篇成果中选Oral。在8月14日下午的PaperAwards环节,字节跳动旗下成果《G-DIG:TowardsGradient-basedDIverseandhigh-qualityInstructio
-
7月17日,三星电子面向中国市场发布新一代GalaxyZ系列产品。会上,三星电子与火山引擎官宣合作,为GalaxyZFold6、GalaxyZFlip6手机的智能助手和AI视觉接入豆包大模型,提升手机的智能应用体验。此前,三星在海外新品发布会上公布了与谷歌Gemini的深度合作,在中国区则选择了火山引擎等厂商作为大模型合作方。fenye图说:三星GalaxyZFold6、GalaxyZFlip6手机的智能助手和AI视觉接入豆包大模型除了画圈即搜、实时翻译、录音转录等已经披露过的AI功能外,本次中国地区发布
-
来自清华大学AIR、北京大学、南京大学的研究团队提出了ESM-AA模型。该模型在蛋白质语言建模领域取得了重要进展,提供了一套整合多尺度信息的统一建模方案。它是首个能同时处理氨基酸信息和原子信息的蛋白质预训练语言模型。模型的出色性能展示了多尺度统一建模在克服现有局限和解锁新能力方面的巨大潜力。作为基座模型,ESM-AA获得了多位学者的关注与广泛讨论(截图见下方),被认为有潜力基于ESM-AA开发出可与AlphaFold3、RoseTTAFoldAll-Atom相竞争的模型,为研究不同生物结构间的相互作用开辟
-
golang学习网今天将给大家带来《字节跳动筋斗云人才计划开启》,感兴趣的朋友请继续看下去吧!以下内容将会涉及到等等知识点,如果你是正在学习科技周边或者已经是大佬级别了,都非常欢
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文作者蒋楠是北京大学智能学院二年级博士生,指导教师朱毅鑫教授,与北京通用人工智能研究院黄思远博士联合开展研究工作。他的研究重点是人-物交互理解和数字人的动作生成,并于ICCV,CVPR
-
7月5日,在2024世界人工智能大会“可信大模型论坛”上,支付宝公布了其AI技术在医疗领域布局的最新进展:发布多模态医疗大模型,同时,全新推出包括医疗可信一体机、可信云等多款数智化解决方案。现场,支付宝还与人民卫生出版社、北京大学医学部、浙江省卫生健康委等20家机构,联合发起AI医疗共建计划,共同探索AI数智技术底座与创新应用服务。支付宝多模态医疗大模型亮相经过半年多测试打磨,支付宝医疗大模型正式亮相,这也是国内首批多模态医疗大模型之一。蚂蚁集团大模型应用部总经理顾进杰介绍了背后的
-
编辑|KX传统的材料发现依赖反复试验或偶然发现,效率低下且成本高昂。AI在发现新型催化剂方面潜力巨大。然而,受到算法的选择,以及数据质量和数量的影响。在此,来自厦门大学、深圳大学、武汉大学、南京航空航天大学和英国利物浦大学的研究团队开发了一种迁移学习范式,结合了预训练模型、集成学习和主动学习,能够预测未被发现的钙钛矿氧化物,并增强该反应的通用性。通过筛选16,050种成分,鉴定和合成了36种新的钙钛矿氧化物,其中包括13种纯钙钛矿结构。Pr0.1Sr0.9Co0.5Fe0.5O3(PSCF)和Pr0.1S
-
5月30日,国际人工智能顶会CVPR2024举办的第3届野外像素级视频理解挑战赛(The3rdPixel-levelVideoUnderstandingintheWild,PVUW。下文简称PVUW)公布赛事结果,美图影像研究院(MTLab)再获殊荣,斩获视频语义分割(VSS)、复杂场景视频目标分割(MOSE)双赛道亚军,视频全景分割挑战赛(VPS)赛道季军,这也是美图影像研究院(MTLab)第3次在CVPR大会上摘得奖项,共获得了1金3银3铜的杰出成绩。作为全球范围内计算机视觉领域的顶尖盛会,CVPR凭
-
7月4日,在2024世界人工智能大会上,具身智能公司穹彻智能Noematrix(展位号:H1-A715)宣布推出穹彻具身大脑NoematrixBrain,加速具身智能大模型落地。结合实体机器人,穹彻在完全开放的环境中向现场观众近距离展示了“随手一扔就能叠的衣物折叠”(无限自由度物体操作,复杂物体理解堪比人类)和“削完就能吃的黄瓜削皮”(不规则曲面操作,精细度甚至超越人类水平)等突破性技术,以及家庭地面整理等落地应用。通过这些实时演示和真实互动,穹彻具身大脑的
-
研究者表示,如果Sytem2蒸馏可以成为未来持续学习AI系统的重要特征,则可以进一步提升System2表现不那么好的推理任务的性能。谈到大语言模型(LLM)的策略,一般来说有两种,一种是即时的System1(快速反应),另一种是System2(慢速思考)。其中System2推理倾向于深思熟虑的思维,生成中间思维允许模型(或人类)进行推理和规划,以便成功完成任务或响应指令。在System2推理中,需要付出努力的心理活动,尤其是在System1(更自动化思维)可能出错的情况下。因此,System1被定义为Tr