-
不久之前,李飞飞教授的空间智能创业公司WorldLabs以及全明星的创业阵容正式亮相。随后,李飞飞与另一位联合创始人JustinJohnson接受了a16z的专访。在这次访谈播客中,李飞飞重点分享了AI领域新的研究前沿:空间智能。她说:「视觉空间智能非常根本,与语言一样根本」。主持人:过去两年出现了很多消费级AI公司。但您其实已经在这个领域深耕了几十年,您是一路看着AI发展到如今的并且做出过非常关键的贡献。现在正是激动人心的时刻,对吗?李飞飞:回望过去,AI确实正处在一个激动人心的时刻。我个人已经在这个领
-
9月19日,全球服务机器人领军企业普渡机器人正式发布其初代类人形机器人PUDUD7。基于仿生双臂和全向移动底盘设计,PUDUD7能够在多个场景中执行复杂任务操作,更好地满足跨行业客户真实的多样化需求。该款机器人预计将在2025年实现全面商业化落地,为通用具身服务机器人的商业化应用带来突破性变革。普渡初代类人形机器人PUDUD7普渡机器人创始人兼CEO张涛表示:“作为普渡的核心价值观,发明家精神推动我们不断创新与进步。PUDUD7的发布标志着我们在构建专用型机器人、类人形机器人和人形机器人的重要
-
实验证明,大模型的System2能力还有待开发。规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力。随着大型语言模型(LLM)的出现,人们对LLM是否具有这种规划能力产生了极大的兴趣。最近,OpenAI发布了o1模型,一举创造了很多历史记录。o1模型拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力,相比GPT-4o有巨大提升,让大模型的上限从「没法看」直接上升到优秀水平,不专门训练直接数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。那么,o1模型是否具备上述规划能力?2
-
三年走来,每一步都「作数」。懂场景者得AI卷数据:从治理到流通除了利用AI大模型重构分析、营销、客服三大企业级智能应用,负责数据治理的中台Dataphin也迎来最大变化——加入了DataAgent。现在,只需三步,就可以构建企业专属的数据资产智能体,这也是业内首个场景化智能找数方案。建立企业数据资产全景和目录是Dataphin主要能力之一,现在,借助大模型,将企业数据资产目录构建为一个智能知识库,通过对话就能快速摸清「家底」,还能帮助用户快速定位业务相关数据资产。在个性化数据分析能
-
编辑|KX一纳米(nm)是一米的十亿分之一,而人类一根头发的宽度约为100,000nm。如今,人工智能可以检测到细胞内小至20nm的重排,即比人类头发宽度小5,000倍。而这些改变太小太微妙,靠人类仅用传统方法是无法发现的。近日,南方医科大学和西班牙巴塞罗那科学技术研究所的研究团队,开发了一种细胞核人工智能(AINU)工具,可以在纳米级分辨率下识别特定的细胞核特征。它可以区分癌细胞和正常细胞,并检测出细胞内病毒感染的早期阶段。论文共同一作、南方医科大学广东省人民医院(GDPH)研究员LimeiZhong说
-
9月19-21日,以「共赢行业智能化」为主题的第九届华为全联接大会(HUAWEICONNECT2024)在上海举办。活动期间,腾讯音乐娱乐集团(TME)天琴实验室AI大模型负责人吴斌博士在华为云峰会发表主题演讲。天琴实验室自研创新的MUSELight大模型推理加速解决方案与华为云昇腾AI云服务深度合作共建,并首次对外发布StableDiffusion系列视觉大模型推理加速方案lyraSD的昇腾适配方案。吴斌博士表示,双方共同努力实现了AI算力的自主创新和领先突破,讲为用户提供更美好的音乐娱乐体验,并赋能行
-
今日,首届中国数字人大会在北京拉开帷幕,一只以四川省阿坝州大熊猫“苏琳”为原型的3D数字熊猫吸引了大量围观和驻足。数字熊猫“苏琳”身着带有藏、羌族元素的特色服装,在现场亲切自然地与观众进行语音互动,介绍并讲解阿坝州本地的景区特色和风土人情,还时不时地跳起舞来。这是由中国电信四川公司与中国电信人工智能研究院(TeleAI)共同建立的人工智能联合实验室最新推出的落地项目之一,是基于首次面向文旅产业推出的创新产品“TeleTrip-星辰文旅&rdquo
-
本文作者来自于香港中文大学深圳和深圳大数据研究院。其中第一作者为香港中文大学深圳博士生王熙栋和研究助理宋定杰,主要研究方向分别为医疗AGI和多模态学习;博士生陈舒年研究方向为多模态学习,博士生张辰研究方向为高效语言模型。通讯作者为香港中文大学深圳数据科学学院王本友教授。扩展多模态大语言模型(MLLMs)的长上下文能力对于视频理解、高分辨率图像理解以及多模态智能体至关重要。这涉及一系列系统性的优化,包括模型架构、数据构建和训练策略,尤其要解决诸如随着图像增多性能下降以及高计算成本等挑战。该团队将模型架构调整
-
waitlist挤爆了。草莓大模型又来了。昨天,GitHubCEOThomasDohmke预告了一则关于草莓模型的推文,一时间勾起了很多人的好奇心。很多人猜测GitHubCopilot要集成OpenAI最新的o1系列模型了,毕竟再不升级就可能要被最近势头很猛的Cursor抢走更多用户了。果不其然,今天一大早,GitHub便官宣了在VSCode中为GitHubCopilotChat开放o1-preview和o1-mini的早期访问权。同时,用户也可以在GithubModels模型托管平台选择使用o1-pre
-
这是AI智能体在大部分科学研究中超越人类的第一个案例,或许会彻底改变人类与科学文献互动的方式。最近一段时间,有关AI科学家的研究越来越多。大语言模型(LLM)有望帮助科学家检索、综合和总结文献,提升人们的工作效率,但在研究工作中使用仍然有很多限制。对于科研来说,事实性至关重要,而大模型会产生幻觉,有时会自信地陈述没有任何现有来源或证据的信息。另外,科学需要极其注重细节,而大模型在面对具有挑战性的推理问题时可能会忽略或误用细节。最后,目前科学文献的检索和推理基准尚不完善。AI无法参考整篇文献,而是局限于摘要
-
训练完就直接上模型。我们都知道,Mistral团队向来「人狠话不多」。昨天下午,他们又又又丢出了一个不带任何注解的磁力链接。解析一下这个链接,可以看到大小共23.64GB,其中包含4个文件,其中最大的文件是一个封装的多模态大模型。动作快的非官方Mistral社区已经将该模型上传到了HuggingFace。磁力链接:magnet:?xt=urn:btih:7278e625de2b1da598b23954c13933047126238a&dn=pixtral-12b-240910HuggingFace地址:h
-
你想喝瓶啤酒,于是就把桌子叫了过来。这不是吃了菌子才有的场景,而是国外网友的一项发明,名叫Carpentopod。整个桌子有12条腿,里面内置了电机,是木工、电子和编程结合的产物。只要按下遥控器,桌子就会向你走来,像一个家用机器人一样。从图上可以看出,Carpentopod走起来非常平稳,这是它的腿部参数不断「进化」的结果。这个「进化」过程在软件的虚拟环境中进行,数千个虚拟腿部变体在该环境中竞争,只有得分高的腿部变体才能混合「基因」。如此精巧的结构制作起来自然是非常不易。作者表示,「早在2008年,我就写
-
近段时间,AI编程工具Cursor的风头可说是一时无两,其表现卓越、性能强大。近日,Cursor一位重要研究者参与的一篇相关论文发布了,其中提出了一种方法,可通过搜索自然语言的规划来提升Claude3.5Sonnet等LLM的代码生成能力。具体来说,他们提出的方法名为PlanSearch(规划搜索)。主导团队是ScaleAI,本文一作为ScaleAI研究者EvanWang。二作FedericoCassano现已加入如今炙手可热的AI编程工具公司Cursor。他曾参与创立了GammaTauAI项目,该项目的
-
提到“春节”,你首先会想到什么?热气腾腾的年夜饭,大门前福气满满的春联,摩肩接踵的车站,还是一眼看不到排队尽头的游玩景点?不知从什么时候起,各大主题乐园不再只是为孩子打造的童话世界,也俨然成为了成年人的理想国。无数的成年人换上霍格沃茨制服,挑选自己的魔杖,逃离“麻瓜世界”,前往环球影城;许多成年的迪士尼粉丝,也蜂拥至上海迪士尼乐园,在全球首个“疯狂动物城主题园区”亦或是香港迪士尼乐园的全球首个“冰雪奇缘主题园区&rdquo
-
小模型崛起了。上个月,Meta发布了Llama3.1系列模型,其中包括Meta迄今为止最大的405B模型,以及两个较小的模型,参数量分别为700亿和80亿。Llama3.1被认为是引领了开源新时代。然而,新一代的模型虽然性能强大,但部署时仍需要大量计算资源。因此,业界出现了另一种趋势,即开发小型语言模型(SLM),这种模型在许多语言任务中表现足够出色,部署起来也非常便宜。最近,英伟达研究表明,结构化权重剪枝与知识蒸馏相结合,可以从初始较大的模型中逐步获得较小的语言模型。图灵奖得主、Meta首席AI科学家Y