-
人类的教育方式,对大模型而言也很适用。养育孩子时,古往今来人们都会谈到一种重要方法:以身作则。也就是让自己成为孩子模仿学习的范例,而不是单纯地告诉他们应该怎么做。在训练大语言模型(LLM)时,我们或许也能采用这样的方法——向模型进行演示。近日,斯坦福大学杨笛一团队提出了一种新框架DITTO,可通过少量演示(用户提供的期望行为示例)来将LLM与特定设置对齐。这些示例可以从用户现有的交互日志获取,也能通过直接编辑LLM的输出得到。这样就可以让模型针对不同的用户和任务高效地理解并对齐用户
-
人类的教育方式,对大模型而言也很适用。养育孩子时,古往今来人们都会谈到一种重要方法:以身作则。也就是让自己成为孩子模仿学习的范例,而不是单纯地告诉他们应该怎么做。在训练大语言模型(LLM)时,我们或许也能采用这样的方法——向模型进行演示。近日,斯坦福大学杨笛一团队提出了一种新框架DITTO,可通过少量演示(用户提供的期望行为示例)来将LLM与特定设置对齐。这些示例可以从用户现有的交互日志获取,也能通过直接编辑LLM的输出得到。这样就可以让模型针对不同的用户和任务高效地理解并对齐用户
-
基于Transformer架构的大型语言模型在各种基准测试中展现出优异性能,但数百亿、千亿乃至万亿量级的参数规模会带来高昂的服务成本。例如GPT-3有1750亿参数,采用FP16存储,模型大小约为350GB,而即使是英伟达最新的B200GPU内存也只有192GB,更不用说其他GPU和边缘设备。大模型压缩,即将大模型“瘦身”后塞进资源受限的场景,以减少模型存储、访存和计算开销。在尽量不损失模型性能的前提下,提高大模型推理吞吐速度,使大模型在物联网边缘设备、嵌入式机器人、离线移动应用等
-
机器之能报道编辑:Sia国内大模型是不是要迅速跟上?最近,「北美知乎」问答社区Quora旗下的AI聊天平台Poe,推出了一项名为「Previews」的新功能。有了这个实时预览功能,用户就能直接查看和使用在Poe聊天中生成的Web应用程序。也就是说,在Poe,你可以和一些非常擅长编码的LLM聊天,如Claude-3.5-Sonnet、GPT-4、Gemini1.5Pro。聊天过程中生成的代码片段、网页设计、游戏等内容,都能在这个窗口预览到,还能上手体验。上手体验第一把时,编程0基础的小编就被吓到了。咱们直接
-
两年前,在美国科罗拉多州博览会艺术比赛上,一幅名为《太空歌剧院》的作品拿了第一名。此画气势恢弘、明暗有致,颇有法国象征主义画家古斯塔夫・莫罗的味道。只不过,它不是人画的,而是由一位没有任何绘画基础的参赛者,借助AI绘图工具完成的。我们再把时间拨回到2018年。彼时,一幅名为《埃德蒙・贝拉米画像》的AI画作在纽约佳士得拍卖行,拍出了40多万美元的高价。这是第一幅被拍卖的人工智能作品,由此也标志着AI艺术作品开始被市场认可。如今,AI绘画早已司空见惯,国内外的AI玩家纷纷下场,都要把这一赛道卷冒烟了。比如国外
-
7月31日晚,在巴黎奥运会自由式小轮车女子公园赛决赛中,18岁中国选手邓雅文高水平发挥,为中国代表团夺得第8金。在比赛直播中的回放环节,邓雅文骑着小轮车高高跃起的身姿突然定格,镜头环绕,将这个瞬间的美感放大,给观众带来前所未有的视觉享受。这就是网上热议的奥运“子弹时间”,技术来自中国的阿里云。(图巴黎奥运会资格赛期间进行了多镜头回放系统测试)“子弹时间”覆盖21个项目据奥林匹克广播服务公司(以下简称OBS)介绍,巴黎奥运会采用中国阿里云AI增强的全新转播技术
-
干杯!当论文讨论细致到词句,是什么体验?最近,斯坦福大学的学生针对arXiv论文创建了一个开放讨论论坛——alphaXiv,可以直接在任何arXiv论文之上发布问题和评论。网站链接:https://alphaxiv.org/其实不需要专门访问这个网站,只需将任何URL中的arXiv更改为alphaXiv就可以直接在alphaXiv论坛上打开相应论文:可以精准定位到论文中的段落、句子:右侧讨论区,用户可以发表问题询问作者论文思路、细节,例如:也可以针对论文内容发表评论,例如:「给出至
-
干杯!当论文讨论细致到词句,是什么体验?最近,斯坦福大学的学生针对arXiv论文创建了一个开放讨论论坛——alphaXiv,可以直接在任何arXiv论文之上发布问题和评论。网站链接:https://alphaxiv.org/其实不需要专门访问这个网站,只需将任何URL中的arXiv更改为alphaXiv就可以直接在alphaXiv论坛上打开相应论文:可以精准定位到论文中的段落、句子:右侧讨论区,用户可以发表问题询问作者论文思路、细节,例如:也可以针对论文内容发表评论,例如:「给出至
-
Kimi:一句话,十几秒钟,一份PPT就新鲜出炉了。PPT这玩意儿,可太招人烦了!开个碰头会,要有PPT;写个周报,要做PPT;拉个投资,要展示PPT;就连控诉出轨,都得发个PPT。大学更像是学了个PPT专业,上课看PPT,下课做PPT。或许,37年前丹尼斯・奥斯汀发明PPT时也没想到,有一天PPT竟如此泛滥成灾。吗喽们做PPT的苦逼经历,说起来都是泪。「一份二十多页的PPT花了三个月,改了几十遍,看到PPT都想吐」;「最巅峰的时候,一天做了五个PPT,连呼吸都是PPT」;「临时开个会,都要做个PPT,人
-
在2024年全球开发者大会上,苹果重磅推出了AppleIntelligence,这是一个全新的个性化智能系统,可以提供实用的智能服务,覆盖iPhone、iPad和Mac,并深度集成在iOS18、iPadOS18和macOSSequoia中。库克曾经表示,AppleIntelligence是苹果创新的新篇章,将改变用户使用产品的方式。他强调,苹果独特的方法结合了生成式人工智能和用户的个人信息,能提供真正有用的智能服务。此外,AppleIntelligence能够以完全私密和安全的方式访问信息,帮助用户完成对
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com该论文的第一作者和通讯作者均来自北京大学王选计算机研究所的VDIG(VisualDataInterpretingandGeneration)实验室,第一作者为博士生周啸宇,通讯作者为博士
-
近日,AI机器人公司星尘智能(Astribot)宣布完成数千万美元Pre-A轮融资,由经纬创投领投,道彤投资及清辉投资等产业资本跟投,老股东云启资本跟投。华兴资本担任独家财务顾问。本轮融资将用于顶尖人才招募、研发投入、商业化部署等工作。星尘智能于2022年12月在深圳成立,致力于让数十亿人拥有AI机器人助理,推动人机共存、共创、共赢的愿景。公司专注研发“新一代最强AI机器人助理”,能像人一样学习、思考和劳动,与人流畅智能交互,会使用人的工具和设备、帮人完成枯燥、困难或危险的任务,不断拓展应用场景边界,实现
-
黄仁勋表示:「AI的下一波浪潮是机器人,其中最令人兴奋的发展之一是人形机器人。」如今,ProjectGR00T又迈出了重要的一步。昨日,英伟达创始人黄仁勋在SIGGRAPH2024Keynote演讲中讲到了其人形机器人通用基础模型「ProjectGR00T」。该模型在功能上迎来了一系列更新。德克萨斯大学奥斯汀分校助理教授、英伟达高级研究科学家朱玉可发推,在视频中演示了英伟达如何将通用家务机器人大规模仿真训练框架RoboCasa和MimicGen系统整合到英伟达Omniverse平台和Isaac机器人开发平
-
编辑|KX传统的材料发现依赖反复试验或偶然发现,效率低下且成本高昂。AI在发现新型催化剂方面潜力巨大。然而,受到算法的选择,以及数据质量和数量的影响。在此,来自厦门大学、深圳大学、武汉大学、南京航空航天大学和英国利物浦大学的研究团队开发了一种迁移学习范式,结合了预训练模型、集成学习和主动学习,能够预测未被发现的钙钛矿氧化物,并增强该反应的通用性。通过筛选16,050种成分,鉴定和合成了36种新的钙钛矿氧化物,其中包括13种纯钙钛矿结构。Pr0.1Sr0.9Co0.5Fe0.5O3(PSCF)和Pr0.1S
-
CPAL会议简介CPAL是一年一度的研究型学术会议,专注于解决机器学习、信号处理、优化等领域中普遍存在的简约(Parsimonious)、低维结构(LowDimensionalStructures)问题。创办这个会议的出发点,即将其设计为一个普遍的科学论坛,使机器学习、应用数学、信号处理、优化、智能系统以及所有相关的科学和工程领域的研究人员能够聚集在一起,分享见解,并最终努力达成一个共同的现代理论和计算框架,从简约学习的角度理解智能和科学。首届CPAL于2024年1月在香港大学成功举办,会议吸引了数百名世