-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com在大语言模型(LLMs)后训练任务中,由于高质量的特定领域数据十分稀缺,合成数据已成为重要资源。虽然已有多种方法被用于生成合成数据,但合成数据的理论理解仍存在缺口。为了解决这一问题,本文
-
10月8日,川金诺发布2024年前三季度业绩预告称,1-9月预计实现营收210,000万元-230,000万元,同比增长9.67%—20.12%;预计归属于上市公司股东的净利润为10,100万元—12,100万元,较上年同期增长193.44%—211.94%;预计归属于上市公司股东的扣除非常性损益的净利润为9,180万元—11,180万元,较上年同期增长178.89%—196.07%。其中,第三季度预计实现营收80,000万元-86,000万元,同比增长2.27%—9.94%;预计归属于上市公司股东的净利
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文第一作者柳斐(https://feiliu36.github.io/)是香港城市大学计算机科学系博士生,师从张青富教授。研究领域为计算智能,自动算法设计,组合优化等。姚一鸣,郭平,杨
-
本文作者来自于香港中文大学深圳和深圳大数据研究院。其中第一作者为香港中文大学深圳博士生王熙栋和研究助理宋定杰,主要研究方向分别为医疗AGI和多模态学习;博士生陈舒年研究方向为多模态学习,博士生张辰研究方向为高效语言模型。通讯作者为香港中文大学深圳数据科学学院王本友教授。扩展多模态大语言模型(MLLMs)的长上下文能力对于视频理解、高分辨率图像理解以及多模态智能体至关重要。这涉及一系列系统性的优化,包括模型架构、数据构建和训练策略,尤其要解决诸如随着图像增多性能下降以及高计算成本等挑战。该团队将模型架构调整
-
1.汽车以旧换新政策重点领域汽车是消费品以旧换新政策实施的重点领域。近期,商务部等部门联合印发《关于进一步做好汽车以旧换新有关工作的通知》,此后多地陆续出台政策文件,从提高补贴标准、扩大补贴范围、增加资金支持等方面,加大力度促进汽车以旧换新。2.汽车以旧换新政策内容汽车以旧换新,包括报废更新和置换更新。(1)汽车报废更新在汽车报废更新方面,《通知》明确,对符合相关规定要求,报废旧车并购买新车的个人消费者,补贴标准由购买新能源乘用车补1万元、购买燃油乘用车补贴7000元,分别提高至2万元和1.5万元。(2)
-
美国当地时间10月10日晚(北京时间10月11日上午),特斯拉在“We,Robot”主题发布会上正式发布Robotaxi(无人驾驶出租车),并命名为Cybercab。特斯拉CEO马斯克在发布会上发表了如下演讲:欢迎大家!我们今天晚上给大家准备了一场非常精彩的展示,我相信大家应该都会喜欢的。正如大家所见,我刚刚就搭乘着我们的Robotaxi无人驾驶出租车来到了这里,外面还有20多辆这样的车,这些Robotaxi一直都在路上行驶,而且车里是没有人驾驶的。今天晚上我们会有50辆搭载了完全自动驾驶能力FSD的汽车
-
arXiv:2106.14490v5如果你对arXiv的版本号有所了解,你就知道这篇论文已经更新了4次,现在已经来到了第5个版本。实际上,这个arXiv编号属于上海交通大学牛力团队一篇持续更新了四年的综述报告。该综述介绍了图像合成(imagecomposition)领域需要解决的问题和应运而生的子任务,总结了各个子任务的数据集、传统方法、深度学习方法和实验现象,从鸿蒙初辟写到尘埃落地。论文标题:MakingImagesRealAgain:AComprehensiveSurveyonDeepImageCom
-
看来,Meta下一个大模型发展的重点之一就是Agent了!近日的一系列消息表明,Meta正在快速组建一支Agent人才团队。先是两个月前,原苹果首任AI总监RussSalakhutdinov宣布加入Meta生成式AI团队,专注多模态大模型和Agent。今日,评估智能体性能的排行榜WebArena作者ShuyanZhou也宣布加入Russ的团队。ShuyanZhou上半年在CMU获得了博士学位,导师是GrahamNeubig。同时,她还将在2025年秋季担任杜克大学计算机科学系助理教授。RussSalakh
-
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活的输入信号,以便人们可以以更多样化的方式与模型交互。而更长的上下文使模型处理的信息更多,例如长文档、长视频,这种能力同样为更多现实世界的应用程序提供了所需的功能。然而,目前面临的问题是一些工作已经启用了长上下文视觉语言模型(VLM),但通常是采用简化的方法,而不是提供一个全
-
1.深圳大疆科技有限公司宣布,已对美国国防部将其列入中国军事公司名单的决定提起诉讼。大疆作为全球最大的消费级无人机制造商,其发言人表示,公司已与美国国防部就此事协商超过16个月,但未取得成果。大疆发言人强调:“大疆认为,除了向联邦法院寻求救济外,别无他法。大疆不受中国军方所有或控制,美国国防部也承认,大疆生产的是消费级和商用无人机,而非军用无人机。”《国防授权法案》中包含美国国防部编制的中国军事公司名单,旨在阻止中国获取由“看似民用实体”开发的先进技术。该法案要求美国国防部确定在美国直接或间接运营的此类公
-
谷歌终于把人机交互给玩明白了?很多整天对着电脑的同学们难免腰酸背疼,有时会发出这样的感叹:我对这键盘受够了!那么问题来了:应该换个机械键盘还是分体式键盘呢?让我们看看全球顶尖的科技大厂,对未来人机交互形态的思考吧:它是Gboard双面键盘,又被称为「无限键盘」,发明者是谷歌日本。它乍看起来像一个甜甜圈。该设备的两面都有按键,可以无限循环地打字。从一开始,Google团队就想要打造一款可以在正反两面,能以任意姿势使用,甚至多人合作使用的键盘——你看这理念有多超前。所以我们最终看到的成
-
1.据中关村协同基金消息,青田恒韧智能科技有限公司(简称“青田恒韧”)近日完成新一轮融资,由启迪之星投资。资金将用于研发制造半导体前道电子束量测设备CD-SEM。2.青田恒韧专注于研发制造CD-SEM设备。团队成员于2019年底提出研发CD-SEM设备的目标。3.2021年年中,完成DEMO机软件工作。4.2022年,全面转向CD-SEM用扫描电镜研究。5.2023年年中,初步掌握高端CD-SEM用扫描电镜底层核心技术。6.2023年年底,完成CD-SEM设备软件部分完整架构工作。7.青田恒韧创始人赵博士
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com论文第一作者林宏彬来自香港中文大学(深圳)DeepBit实验室,导师为李镇老师。实验室专注于利用人工智能技术进行跨学科研究,例如自动驾驶的三维感知、医学成像和分子理解的多模态数据分析和生
-
今日,首届中国数字人大会在北京拉开帷幕,一只以四川省阿坝州大熊猫“苏琳”为原型的3D数字熊猫吸引了大量围观和驻足。数字熊猫“苏琳”身着带有藏、羌族元素的特色服装,在现场亲切自然地与观众进行语音互动,介绍并讲解阿坝州本地的景区特色和风土人情,还时不时地跳起舞来。这是由中国电信四川公司与中国电信人工智能研究院(TeleAI)共同建立的人工智能联合实验室最新推出的落地项目之一,是基于首次面向文旅产业推出的创新产品“TeleTrip-星辰文旅&rdquo
-
重写后的内容:1.南方科技大学深港微电子学院助理教授林苑菁课题组在电化学材料设计和器件性能稳定性研究方面取得突破,发表四篇研究论文于《自然纳米技术》、《自然通讯》、《能源与环境科学》和《先进材料》期刊。2.电化学器件通过固-液、固-固界面上的物质吸附、脱附和氧化还原反应发挥功能。因此,材料的微纳界面演化和组分优化对器件电化学性能至关重要。课题组研究了多功能微纳电化学器件的材料组分和界面结构调控策略。3.针对电化学器件的稳定性问题,课题组从电化学储能器件入手,探索纳米材料颗粒和反应界面的结构演化,揭示了性能