-
如果AI模型给的答案一点也看不懂,你敢用吗?随着机器学习系统在更重要的领域得到应用,证明为什么我们可以信任它们的输出,并明确何时不应信任它们,变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是,要求系统对其输出产生一种解释,这种解释对人类或另一个受信任的系统来说是可读的,即可以完全理解以至于任何可能的错误都可以被发现。例如,为了建立对司法系统的信任,我们要求法院提供清晰易读的书面意见,解释并支持其决策。对于大型语言模型来说,我们也可以采用类似的方法。不过,在采用这种方法时,确保语言模型生成的是易于
-
7月31日晚,在巴黎奥运会自由式小轮车女子公园赛决赛中,18岁中国选手邓雅文高水平发挥,为中国代表团夺得第8金。在比赛直播中的回放环节,邓雅文骑着小轮车高高跃起的身姿突然定格,镜头环绕,将这个瞬间的美感放大,给观众带来前所未有的视觉享受。这就是网上热议的奥运“子弹时间”,技术来自中国的阿里云。(图巴黎奥运会资格赛期间进行了多镜头回放系统测试)“子弹时间”覆盖21个项目据奥林匹克广播服务公司(以下简称OBS)介绍,巴黎奥运会采用中国阿里云AI增强的全新转播技术
-
世界机器人大会(WorldRobotConference,WRC)是全球最具影响力的机器人领域盛会之一,正在北京盛大召开。本届大会以“共育新质生产力共享智能新未来”为主题,汇集了近170家国内外机器人企业参与。大会现场,来自北京具身智能机器人创新中心、优必选等企业的27款人形机器人集体亮相,创历届世界机器人大会之最。在现场,有一个展台十分亮眼,这里竟然有一辆宝蓝色的汽车停在展台上。1.人形机器人工业场景解决方案优必选首次展示了“人形机器人工业场景解决方案”。不同于传统的机器人在舞台上的表演,优必选的机器人
-
11月19日,以“创想无限”为主题的2023华为开发者大赛全球总决赛及颁奖典礼在华为松山湖基地圆满落幕。本届大赛开设云底座和产业两大赛道,覆盖中国以及亚太、拉美、欧洲、土耳其等区域,吸引了来自全球30多个国家和地区的19000多名开发者、3000多支团队报名参赛。在颁奖典礼上,华为颁发了3个金奖、6个银奖、9个铜奖、7个创新奖等超过25个奖项。2023华为开发者大赛全球总决赛大合照本届大赛自启动报名以来,备受全球各领域开发者关注,涌现了众多具有丰富想象力和创造力的优秀作品,包括应用
-
从125M到1.3B的大模型,性能都有提升。难以置信,这件事终于发生了。一种全新的大语言模型(LLM)架构有望代替至今在AI领域如日中天的Transformer,性能也比Mamba更好。本周一,有关Test-TimeTraining(TTT)的论文成为了人工智能社区热议的话题。论文链接:https://arxiv.org/abs/2407.04620该研究的作者来自斯坦福大学、加州大学伯克利分校、加州大学圣迭戈分校和Meta。他们设计了一种新架构TTT,用机器学习模型取代了RNN的隐藏状态。该模型通过输入
-
同样是图生视频,PaintsUndo走出了不一样的路线。ControlNet作者LvminZhang又开始整活了!这次瞄准绘画领域。新项目PaintsUndo刚上线不久,就收获1.4kstar(还在疯狂涨)。项目地址:https://github.com/lllyasviel/Paints-UNDO通过该项目,用户输入一张静态图像,PaintsUndo就能自动帮你生成整个绘画的全过程视频,从线稿到成品都有迹可循。绘制过程,线条变化多端甚是神奇,最终视频结果和原图像非常相似:我们再来看一个完整的绘画过程。P
-
网友很好奇,Mathstral能不能搞定「9.11和9.9谁大」这一问题。昨天,AI圈竟然被「9.11和9.9谁大」这样简单的问题攻陷了,包括OpenAIGPT-4o、GoogleGemini等在内的大语言模型都翻了车。这让我们看到,大语言模型在处理一些数字问题时并不能像人类那样理解并给出正确的答案。对于数字以及复杂的数学问题,专用模型更术业有专攻。今天,法国大模型独角兽MistralAI发布了一个专注于数学推理和科学发现的7B大模型「Mathstral」,来解决需要复杂、多步骤逻辑推理的高级数学问题。该
-
7月4日,2024世界人工智能大会在上海拉开帷幕。教育科技公司网易有道惊艳亮相,在大会现场全新AI大模型学习硬件“有道词典笔X7”重磅登场,标志着词典笔开启全科辅导新时代。在有道展台上,除了首秀的有道词典笔X7,一系列令人瞩目的创新成果悉数展出。既是听力神器、又是口语教练的听力宝E6Pro,全球首个虚拟人口语私教HiEcho,首个高度集成化智能体育终端有道趣动屏等基于国内首个教育大模型“子曰”的十余款最新应用惊艳亮相,展现了网易有道在教育科技融合创新方面的深
-
清华成绩亮眼。第47届国际计算机协会信息检索大会(ACMSIGIR)于2024年7月14日至18日在美国华盛顿特区举行。该会议是信息检索领域的顶级学术会议。刚刚,大会公布了最佳论文奖、最佳论文亚军、最佳论文荣誉提名奖以及时间检验奖等奖项。其中,清华大学、中国人民大学高瓴人工智能学院、小红书团队获得了最佳论文;来自格拉斯哥大学、比萨大学的研究者摘得亚军;最佳论文荣誉提名奖颁给了山东大学(青岛)、莱顿大学、阿姆斯特丹大学的研究者;时间检验奖颁给了清华大学、加州大学圣克鲁斯分校的研究者。接下来,我们来看获奖论文
-
像听书一样「读」论文。先来听一段英文播客,内容是不是很熟悉?是的,这俩人就是在聊那篇《AttentionisAllYouNeed》。在4分半的对话里,他们介绍了论文的核心内容,一问一答,听上去相当自然。播客原址:https://illuminate.google.com/home?pli=1&play=Pa5iGH1___bGy1实际上,播客中对谈的双方都是AI,生成这段四分钟音频内容的产品是Illuminate,来自谷歌。Illuminate是一个将学术论文转化为人工智能生成的音频讨论的项目。
-
8月15日,火山引擎「AI创新巡展」第二站在厦门举办。活动中,火山引擎首次发布了大模型文旅解决方案,以字节豆包大模型和火山引擎AI全栈云基础设施为底座,结合抖音内容生态,助力以厦门为代表的旅游城市重塑文旅形态,打造更加新奇智能的旅行和消费体验。豆包大模型由字节跳动自研,是国内首批通过算法备案的大模型之一,于2024年5月15日正式发布,目前通过字节跳动旗下云服务平台火山引擎面向企业提供服务。截至7月,豆包大模型日均Tokens使用量已突破5000亿,外部客户日均Tokens使用量在两个月间增长了22倍。基
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com该论文的第一作者和通讯作者均来自北京大学王选计算机研究所的VDIG(VisualDataInterpretingandGeneration)实验室,第一作者为博士生周啸宇,通讯作者为博士
-
Seed-TTS是字节跳动豆包大模型团队近期发布的语音生成大模型成果。,它生成的语音几乎与真人**无异**,连发音**缺陷**也能生成出来,尤其在学习模仿人类说话方面,**逼真度**和**流畅度**均有**出色**表现。举例来说,将一段语音提供给Seed-TTS,它就能按文本生成全新语音,且带上原素材的声音特征。原素材(Prompt):Seed-TTS生成的中文语音:突然,身边一阵笑声。我看着他们,意气风发地挺直了胸膛,甩了甩那稍显肉感的双臂,轻笑道:“我身上的肉,是为了掩饰我爆棚的魅力,否则
-
在AIforMath领域,如果你一直找不到合适的资源,这份清单或许会有帮助。刚刚,著名数学家陶哲轩的个人博客又更新了,这次他们整理了一份有用的资源列表,该资源专注于AIforMath,专为那些希望进入数学AI领域的人提供帮助。这份清单发起时间最早可追溯到去年,发起机构由美国国家科学院、工程院和医学院组织的研讨会「人工智能辅助数学推理」提出,陶哲轩担任研讨会主持人。目前,网址资源已经公开。网址:https://docs.google.com/document/d/1kD7H4E28656ua8jOGZ934
-
首个专为各种机器人设计的模拟互动3D社会。还记得斯坦福的AI小镇吗?这是斯坦福的AI研究者打造的一个虚拟环境。在这个小镇上,25个AI智能体正常生活、工作、社交,甚至谈恋爱,每个智能体都有自己的个性和背景故事。智能体的行为和记忆通过大语言模型来驱动,这些模型能够存储和检索智能体的经历,并根据这些记忆来规划行动。(参见《斯坦福的「虚拟小镇」开源了:25个AI智能体照进《西部世界》》)与之类似,最近,来自上海人工智能实验室OpenRobotLab等机构的一批研究者也打造了一个虚拟小镇。不过,生活在其中的是机器