-
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活的输入信号,以便人们可以以更多样化的方式与模型交互。而更长的上下文使模型处理的信息更多,例如长文档、长视频,这种能力同样为更多现实世界的应用程序提供了所需的功能。然而,目前面临的问题是一些工作已经启用了长上下文视觉语言模型(VLM),但通常是采用简化的方法,而不是提供一个全
-
12月25日,昆仑万维AIAgents开发平台「天工SkyAgents」Beta版正式开放测试,用户可在https://model-platform.tiangong.cn/立即体验。昆仑万维「天工SkyAgents」AIAgents开发平台,基于昆仑万维「天工大模型」打造,具备从感知到决策,从决策到执行的自主学习和独立思考能力。用户可以通过自然语言构建自己的单个或多个“私人助理”,并能将不同任务模块化,通过操作系统模块的方式,实现执行包括问题预设、指定回复、知识库创建与检索、意图识别、文本提取、http
-
2024世界人工智能大会暨人工智能全球治理高级别会议(简称"WAIC2024")论坛时间:7月4日-6日展览时间:7月4日-7日"全域链接馆"今年的世界人工智能大会将在展览馆H3馆设立一个6000平方米的"全域链接馆",这一独特的空间将集创新孵化、投资路演、场景发布、供需接洽、人才招聘等全域生态功能于一体,为参展各方提供全方位的交流与合作平台。"FutureTech100未来之星创新孵化专区"特别设立的"FutureTech100未来之星创新孵化专区"将挖掘100+个全球最具创新前瞻性、成长潜力和商业价值
-
编辑|萝卜皮意外的药物相互作用(DDI)是药物研究和临床应用的重要问题,因为其极有可能引发严重的药物不良反应或药物停药。虽然许多深度学习模型在DDI预测方面取得了很好的成果,但模型可解释性以揭示DDI的根本原因尚未得到广泛探索。福州大学、福建医科大学第一附属医院以及元星智药的研究人员提出MeTDDI——一种深度学习框架,具有局部-全局自注意力和共同注意力,用于学习基于主题的DDI预测图。关于可解释性,研究人员对73种药物(13,786个DDI)进行了广泛的评估,MeTDDI可以精确解释涉及58种药物的5,
-
基于ADAS所发现的智能体的性能大大优于最先进的手工设计的基线。基础模型(FM)如GPT和Claude,正在成为通用智能体的强有力支持,被越来越多的用于多种推理和规划任务。然而,在解决问题时,需要的智能体通常是具有多个组件的复合智能体系统,而不是单片模型查询。此外,为了使智能体能够解决复杂的现实世界任务,它们通常需要访问外部工具,例如搜索引擎、代码执行和数据库查询。因此,人们提出了许多有效的智能体系统构建块,例如思维链规划和推理、记忆结构、工具使用和自我反思。尽管这些智能体已经在各种应用中取得了显著的成功
-
2024年8月20日,PICO在北京举办新品沟通会,正式推出旗下首款MR混合现实一体机PICO4Ultra。PICO4Ultra的推出标志着PICO在MR技术领域的全新突破,为用户带来了更为丰富和个性化的混合现实体验。硬件层面,PICO4Ultra搭载了全新高通骁龙®XR2Gen2计算平台以及配备了双目3200万像素彩色透视摄像头和iToF深度感知摄像头,这使得它能够提供出色的性能表现和立体高清彩色透视体验。系统层面,PICO4Ultra引入了全景屏工作台,用户可以在现实空间中同时打开和排布多个虚拟大屏,
-
8月21日,2024世界机器人大会在北京隆重召开。商汤科技旗下家用机器人品牌“元萝卜SenseRobot”家族全系产品集体亮相,并最新发布元萝卜AI下棋机器人——国际象棋专业版(以下简称“元萝卜国象机器人”),成为全球首个走进家庭的国际象棋机器人。作为元萝卜的第三款下棋机器人产品,全新的国象机器人在AI和工程机械方面进行了大量专项技术升级和创新,首次在家用机器人上实现了通过机械爪拾取立体棋子,并进行人机对弈、人人对弈、记谱复盘等功能,
-
,编辑|KX蛋白质与其他分子相结合,促进几乎所有的基础生物活动。因此,了解蛋白质功能对于理解健康、疾病、进化和分子水平上的生物体功能至关重要。然而,超过2亿种蛋白质仍未得到表征,计算方法在很大程度上依赖于蛋白质的结构信息来预测不同质量的注释。近日,来自牛津大学、苏黎世联邦理工学院、上海理工大学和北京师范大学组成的研究团队,设计了一种基于统计的图网络方法,称为PhiGnet,从而促进蛋白质的功能注释和功能位点的识别。PhiGnet不仅在性能上优于其它方法,而且即使在没有结构信息的情况下也缩小了序列-功能差距
-
人工智能的发展速度可能超乎你的想象。自GPT-4将多模态技术引入公众视野以来,多模态大模型进入快速发展阶段,逐渐从单纯的模型研发转向垂直领域的探索和应用,与各行各业深度融合。在界面交互领域,谷歌、苹果等国际科技巨头纷纷投入UI多模态大模型研发,这被视为手机AI革命的必经之路。在此背景下,国内首个UI大模型横空出世。8月17日,在IXDC2024国际体验设计大会上,AI时代设计工具Motiff妙多推出了其自主研发的UI多模态大模型——Motiff妙多大模型。这是全球首个由UI设计工具
-
具身智能的数据从这里来。明天,一年一度的世界机器人大会又将拉开序幕!最近,国内很多机器人公司都发布了新产品,比如稚晖君「智元机器人」公司的第二代人形机器人、星尘智能发布的新一代AI机器人助理AstribotS1。在国外,特斯拉在其人形机器人Optimus训练方面也有了新的消息。该公司正在招募人员穿上动作捕捉服来模仿预期动作,以获得所需的大量机器人训练数据。特斯拉在其招聘网站上将此类人员定义为「数据采集操作员」,主要目标是采集数据、协助处理工程请求以及报告设备反馈。据了解,该职位的时薪最高可达48美元,还有
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com该论文作者均来自于浙江大学李玺教授团队,论文第一作者为博士生苏伟同学,通讯作者为李玺教授(IETFellow,国家杰青)。李玺教授团队近年来在国际权威期刊(如TPAMI、IJCV等)和国
-
2023年是人工智能技术革命的拐点,也是新一轮科技创新、产业升级的重要引擎。站在由AI大模型所开启的智能化时代开端,新一轮科技革命和产业变革正在向纵深演进,以数字生产力推动的数字业务时代正迸发出前所未有的发展机遇。11月23日,由中关村科金与中国信通院人工智能创新中心、人工智能关键技术和应用评测工业和信息化部重点实验室联合主办的2023大模型产业前沿论坛将于北京丽亭华苑酒店正式启幕。本次论坛以“重构未来,产业智能跃迁”为主题,来自产学研投的各界代表,将围绕“大模型产业升
-
5月25日,第七届数字中国建设峰会上,蚂蚁集团正式开源多智能体框架agentUniverse,这是行业首个开源的金融领域多智能体技术框架,该框架核心提供了多智能体协作编排组件,允许开发者对多智能体协作模式进行开发定制,可帮助开发者加快大模型技术在金融场景的落地研发。(图说:蚂蚁集团财富保险事业群智能服务部总经理陆鑫,发布首个开源的金融场景多智能体框架)智能体可简化用户与大模型的互动,允许用户只需指定目标,即可驱动大模型完成任务。据IDC发布的《2024AIGC应用层十大趋势》报告,智能体将是大模型落地业务
-
编辑|ScienceAI基于有限的临床数据,数百种医疗算法已被批准。科学家们正在讨论由谁来测试这些工具,以及如何最好地进行测试。DevinSingh在急诊室目睹了一名儿科患者因长时间等待救治而心脏骤停,这促使他探索AI在缩短等待时间中的应用。Singh利用了SickKids急诊室的分诊数据,与同事们建立了一系列AI模型,用于提供潜在诊断和推荐测试。一项研究表明,这些模型可以加快22.3%的就诊速度,将每位需要进行医学检查的患者的结果处理速度加快近3小时。然而,人工智能算法在研究中的成功只是验证此类干预措施
-
会议简介随着科技的飞速发展,人工智能已经成为了推动社会进步的重要力量。在这个时代,我们有幸见证并参与到分布式人工智能(DistributedArtificialIntelligence,DAI)的创新与应用中。分布式人工智能是人工智能领域的重要分支,这几年引起了越来越多的关注。基于大型语言模型(LLM)的智能体(Agent)异军突起,通过结合大模型的强大语言理解和生成能力,展现出了在自然语言交互、知识推理、任务规划等方面的巨大潜力。AIAgent正在接棒大语言模型,成为当前AI圈的热点话题。Auto-GP