-
8月15日,火山引擎「AI创新巡展」第二站在厦门举办。活动中,火山引擎首次发布了大模型文旅解决方案,以字节豆包大模型和火山引擎AI全栈云基础设施为底座,结合抖音内容生态,助力以厦门为代表的旅游城市重塑文旅形态,打造更加新奇智能的旅行和消费体验。豆包大模型由字节跳动自研,是国内首批通过算法备案的大模型之一,于2024年5月15日正式发布,目前通过字节跳动旗下云服务平台火山引擎面向企业提供服务。截至7月,豆包大模型日均Tokens使用量已突破5000亿,外部客户日均Tokens使用量在两个月间增长了22倍。基
-
对最早布局商用服务机器人赛道的云迹科技来说,已在酒店业的这个市场攻下了擂台,让送物机器人成为我们日常生活里的“伙伴”。在具身智能玩家们纷纷探索如何寻找场景落地、如何让产品持续发挥价值时,云迹科技再次探索出一个新的路径。“理想的AI,应该是让机器像人一样思考,让产品像人一样工作,并结合具体场景应用,端到端解决实际问题,创造价值。AI+具身智能进化的云迹科技机器人,已经做到了这点。其核心之一就是让机器人会使用工具,会理解推理、分配任务,实现了群体智能”云迹科技C
-
我们正在见证又一轮技术革新,这一次是AIGC为个体提供表达自我的工具,让创作变得更加容易和普及,但背后的推动力却并不是「大」模型。两年以来,AIGC技术的发展速度超过所有人的想象,席卷了从文本、图像到视频的各个领域。关于AIGC商业化路径的讨论从来没有停止过,其中,有共识也有路线分化。一方面,通用模型的强大能力令人惊叹,在各行各业展示出应用潜力。特别是DiT、VAR等架构的提出,让ScalingLaw实现了从文本到视觉生成领域的跨越。在这一法则的指引下,很多大模型厂商朝着增加训练数据、算力投入和堆积参数的
-
11月19日,以“创想无限”为主题的2023华为开发者大赛全球总决赛及颁奖典礼在华为松山湖基地圆满落幕。本届大赛开设云底座和产业两大赛道,覆盖中国以及亚太、拉美、欧洲、土耳其等区域,吸引了来自全球30多个国家和地区的19000多名开发者、3000多支团队报名参赛。在颁奖典礼上,华为颁发了3个金奖、6个银奖、9个铜奖、7个创新奖等超过25个奖项。2023华为开发者大赛全球总决赛大合照本届大赛自启动报名以来,备受全球各领域开发者关注,涌现了众多具有丰富想象力和创造力的优秀作品,包括应用
-
互相检查,让小模型也能解决大问题。众所周知,LLM很强大,但执行复杂推理的能力还不够强。举个例子,在GSM8K数据集上,Mistral-7B即使使用思维链(CoT)等技术,也只能达到36.5%的准确度。尽管微调确实也能有效地提升推理能力,但大多数LLM依靠的微调数据都是经过GPT-4等更强大模型蒸馏过的,甚至可能原本就是这些强大模型合成的。同时,研究者们也在积极开发一种能提供辅助但也更困难的方法:使用一个更优的教师LLM来提升推理能力。为了在没有更优模型的前提下提升推理能力,一种颇有希望的范式是利用LLM
-
给小伙伴汇报一下LLM创业第一年的进展、纠结和反思。在Amazon呆到第五年的时候就想着创业了,但被疫情耽搁了。到第7年半的时候,觉得太痒了,就提了离职。现在想来,如果有什么事这一辈子总要试下的,就蹭早。因为真开始后会发现有太多新东西要学,总感叹为啥没能早点开始。名字:BosonAI的来源创业前做了一系列用Gluon命名的项目。在量子物理里,Gluon是把夸克绑在一起的一种玻色子,象征这个项目一开始是Amazon和Microsoft的联合项目。当时项目经理拍拍脑袋名字就出来了,但取名对程序员来说很困难,我
-
6月26日,“Make2024钉钉生态大会”在北京举办。会上,钉钉宣布对所有大模型厂商开放,构建中国最开放AI生态。除了通义大模型外,MiniMax、月之暗面、智谱AI、猎户星空、零一万物、百川智能六家大模型厂商已经与钉钉达成合作。目前,钉钉生态伙伴总数超过5600家,其中AI生态伙伴已经超过100家;钉钉AI每天调用量超1000万次。钉钉总裁叶军表示:“模型开放是钉钉生态开放战略的再进一步。随着行业从模型创新走向应用创新,探索大模型的应用场景是钉钉的责任所在。钉钉拥有
-
本周学术界瞩目的焦点,无疑是在泰国曼谷举行的ACL2024顶会。这场盛会吸引了全球众多杰出的研究者,大家汇聚一堂,共同探讨和分享最新学术成果。官方公布的数据显示,本届ACL共收到近5000篇论文投稿,其中940篇被主会录用,168篇工作入选大会口头报告(Oral),录取率低于3.4%,这当中,字节跳动共有5篇成果中选Oral。在8月14日下午的PaperAwards环节,字节跳动旗下成果《G-DIG:TowardsGradient-basedDIverseandhigh-qualityInstructio
-
近期,一个数十年来未解决的数学难题首次取得了进展。推动这项进展的是来自加州大学洛杉矶分校的研究生JamesLeng和麻省理工学院数学研究生AshwinSah、哥伦比亚大学助理教授MehtaabSawhney。其中JamesLeng师从著名数学家陶哲轩,AshwinSah师从离散数学大牛赵宇飞。论文地址:https://arxiv.org/pdf/2402.17995要了解这项研究取得的突破,需要从算术级数说起。等差数列的前n项和称为一个等差级数,也称为算术级数。1936年,数学家PaulErdős和P&a
-
Mamba架构的大模型又一次向Transformer发起了挑战。Mamba架构模型这次终于要「站」起来了?自2023年12月首次推出以来,Mamba便成为了Transformer的强有力竞争对手。此后,采用Mamba架构的模型不断出现,比如Mistral发布的首个基于Mamba架构的开源大模型Codestral7B。今天,阿布扎比技术创新研究所(TII)发布了一个新的开源Mamba模型——FalconMamba7B。先来总结一波FalconMamba7B的亮点:无需增加内存存储,就
-
日前,蚂蚁集团在北京的自有园区——蚂蚁T空间正式启用,蚂蚁集团创新科技总部正式落地北京。蚂蚁集团董事长兼CEO井贤栋在T空间启用仪式上说,“蚂蚁会利用北京人才和科创高地的优势,加大投入,开启蚂蚁科技的全新篇章。”(图说:蚂蚁T空间)北京一直是蚂蚁集团重要的创新研发中心:2010年:支付宝(中国)设立北京分公司2020年:国产分布式数据库OceanBase商业化公司落户北京去年,蚂蚁集团与北京海淀区政府签署战略合作协议,宣布在海淀区设立创新科技总部,覆盖以下四
-
7月25日,火山引擎2024“AI创新巡展”首站成都站透露了字节豆包大模型的最新进展:截至7月,豆包大模型日均Tokens使用量已突破5000亿,平均每家企业客户日均Tokens使用量较5月15日模型发布时期增长22倍。1.豆包大模型由字节跳动自研,原名“云雀”,是国内首批通过算法备案的大模型之一,目前通过字节跳动旗下云服务平台火山引擎面向企业提供服务。自发布之初,豆包大模型便主打使用量大、应用场景丰富。据火山引擎副总裁张鑫介绍,在字节内部,有超过50多个业
-
用Clapper做视频,你只需要当导演就行了。Sora一出,视频领域似乎已经进入了生成式AI时代。不过直到今天,我们仍然没有用上OpenAI的官方视频生成工具,等不及的人们已经开始寻找其他的方法。最近几周,一款开源的视频编辑工具Clapper引发了人们的关注。与很多科技公司提供的视频生成器不同,Clapper是一款开源AI故事可视化工具,于一年前推出原型。它的设计目的并非取代传统视频编辑器,或使用3D场景作为输入的现代AI编辑器。Clapper的理念是集合各类生成式AI技术,让任何人都能通过交互式、迭代和
-
作为全公司产品做的最好的工程师,同时也是代码写得最好的产品经理,你深刻地知道:搞个靠谱的AI应用需要灵感,而好的灵感则需要一个靠谱的demo来验证。然而……当你已喝上了秋天的第一杯奶茶时,你的demo调用的却还是隔壁工位的小胡今年春天部署的第一个大模型…我们都知道:不是小胡懒得更新,而是帮你的demo换个模型API真的有点麻烦……首先,随着模型文件体积的不断增大,仅下载这些文件就需要花费个几天时间;而当文件下载完成后,又常常面临存储空间
-
有人说,「我们期待的是草莓,但他们发布的是羽衣甘蓝。」我们来看看这个「羽衣甘蓝」是做什么用的。一直以来,大模型的编程能力都备受关注,超强AI程序员Devin的问世更是将「AI能否替代程序员」这一话题推上了风口浪尖。最近,Devin也迎来了新对手——初创公司Cosine推出的自主AI程序员Genie。该公司表示,Genie的表现轻松超越了Devin,在第三方基准测试SWE-bench上的得分为30%,而Devin的得分仅为13.8%。这个SWE-Bench是一个用于评估LLM解决Gi