-
原标题:LighttheNight:AMulti-ConditionDiffusionFrameworkforUnpairedLow-LightEnhancementinAutonomousDriving论文链接:https://arxiv.org/pdf/2404.04804.pdf作者单位:克利夫兰州立大学德克萨斯大学奥斯汀分校A*STAR纽约大学加州大学洛杉矶分校论文思路:LightDiff是一种为自动驾驶的视觉中心感知系统提升效益和可扩展性的技术。相比激光雷达系统,最近受到了相当多的关注。然而,这
-
多传感器与3DGS的结合“基于3D空间中的采样进行计算密集型SLAM任务所需的实时能力”的隐式表达法需要基于NeRF-based+SLAM方法。3DGS以其快速的渲染速度和优越的视觉质量而引人注目。作为一种明确且可以解释的表达法,3DGS使得场景编辑变得简单,有利于众多下游任务的执行。现有的基于辐射场的SLAM系统,主要在光照良好的小规模室内环境中进行测试,并使用顺序RGB-D或RGB输入获得令人满意的结果。当这些方法扩展到具有挑战性的大规模不受控制的室外场景时将会遇到困难,例如具有挑战性的光照条件、杂乱
-
RAG(RiskAssessmentGrid)是一种通过外部知识源增强现有大型语言模型(LLM)的方法,以提供和上下文更相关的答案。在RAG中,检索组件获取额外的信息,响应基于特定来源,然后将这些信息输入到LLM提示中,以使LLM的响应基于这些信息(增强阶段)。与其他技术(例如微调)相比,RAG更经济。它还有减少幻觉的优势,通过基于这些信息(增强阶段)提供额外的上下文——你RAG成为今天LLM任务的(如推荐、文本提取、情感分析等)的流程方法。如果我们进一步分解这个想法,根据用户意图,我们通常会查询一个向量
-
哭死啊,全球狂炼大模型,一互联网的数据不够用,根本不够用。训练模型搞得跟《饥饿游戏》似的,全球AI研究者,都在苦恼怎么才能喂饱这群数据大胃王。尤其在多模态任务中,这一问题尤为突出。一筹莫展之际,来自人大系的初创团队,用自家的新模型,率先在国内把“模型生成数据自己喂自己”变成了现实。而且还是理解侧和生成侧双管齐下,两侧都能生成高质量、多模态的新数据,对模型本身进行数据反哺。模型是啥?中关村论坛上刚刚露面的多模态大模型Awaker1.0。团队是谁?智子引擎。由人大高瓴人工智能学院博士生高一钊创立,高瓴人工智能
-
LoRA(Low-RankAdaptation)是一项流行的技术,旨在微调大语言模型(LLM)。这项技术最初由微软的研究人员提出,并收录在《LORA:LOW-RANKADAPTATIONOFLARGELANGUAGEMODELS》的论文中。LoRA与其他技术不同之处在于,并非调整神经网络的所有参数,而是专注于更新少量低秩矩阵,从而显著减少了训练模型所需的计算量。由于LoRA的微调质量与全模型微调相当,很多人将这种方法称为微调神器。自发布以来,很多人对这项技术感到好奇,希望通过编写代码来更好地理解这一研究。
-
让多智能体开发就像搭积木,阿里巴巴通义实验室开源多智能体编程框架与开发平台AgentScope。该平台专门为多智能体应用开发者打造,旨在提供高易用的编程体验、稳定可靠的运行时保障,并且为开发者提供了分布式和多模态的技术支持。内置了OpenAI、DashScope、Gemini、Ollama等多种不同平台的模型API,深度兼容当下的大模型开源生态。AgentScope提供了多种开箱即用的功能,通过简单拖拽就能搭建多智能体应用。即使没有分布式开发经验的开发者,在AgentScope平台上也能轻松实现上万级别的
-
量化、剪枝、蒸馏,如果你经常关注大语言模型,一定会看到这几个词,单看这几个字,单看这几个字,我们很难理解它们都干了什么,但是这几个词对于现阶段的大语言模型发展特别重要。这篇文章就带大家来认识认识它们,理解其中的原理。模型压缩量化、剪枝、蒸馏,其实是通用的神经网络模型压缩技术,不是大语言模型专有的。模型压缩的意义压缩后,模型文件会变小,其使用的硬盘空间也会变小,加载到内存或者显示时使用的缓存空间也会变小,并且模型的运行速度还可能会有一些提高。通过压缩,使用模型将消耗更少的计算资源,这可以极大的扩展模型的应用
-
最近,扩散模型(DiffusionModel)在图像生成领域取得了显著的进展,为图像生成和视频生成任务带来了前所未有的发展机遇。尽管取得了令人印象深刻的结果,扩散模型在推理过程中天然存在的多步数迭代去噪特性导致了较高的计算成本。近期出现了一系列扩散模型蒸馏算法来加速扩散模型的推理过程。这些方法大致可以分为两类:i)轨迹保持蒸馏;ii)轨迹重构蒸馏。然而,这两类方法会分别受到效果天花板有限或者输出域变化这两个问题的限制。为了解决这些问题,字节跳动技术团队提出了一种名为Hyper-SD的轨迹分段一致性模型。H
-
在复杂的现代商业网络中,高效的供应链管理是成功企业的支柱。从采购到生产、库存管理到配送,供应链中的每个环节都必须无缝同步,以确保及时交货和最佳成本效益。人工智能(AI)是重塑物流和供应链管理格局的变革力量。“人工智能不仅仅是一个流行语;它改变了游戏规则,以前所未有的方式彻底改变了传统的供应链运作。以下是对人工智能如何重塑供应链未来的深入探讨:”需求预测:供应链管理最关键的方面之一是准确预测需求。人工智能算法分析大量历史数据、市场趋势和外部因素,以准确预测需求。通过利用人工智能驱动的需求预测,公司可以优化库
-
在4月22日,腾讯宣布旗下协作SaaS产品全面接入腾讯混元大模型,除企业微信、腾讯会议、腾讯文档等“一门三杰”产品,腾讯乐享、腾讯电子签、腾讯问卷、腾讯云AI代码助手等协作SaaS产品也都已实现智能化升级。腾讯混元自上线起即突出其实用性标签,核心使命之一是优化腾讯系产品的使用体验。腾讯混元大模型目前已扩展至万亿级参数规模,在国内率先采用混合专家模型(MoE)结构,更擅长处理复杂场景和多任务场景,中文整体表现上较于业界领先水平。腾讯混元在数学、代码、逻辑推理、多轮对话和文生成等层面性能卓越,同时提供不同尺寸
-
作者|清华大学王笑楠编辑|凯霞在当今科技飞速发展的时代,新材料的研究与开发已成为推动科学进步和工业革命的关键力量。从能源存储到信息技术,再到生物医药,创新材料的设计、合成及其功能表征是实现这些领域突破的基石。新材料的研究与开发已经呈现出多领域突破的趋势。在能源存储方面,研究人员致力于开发更高效、更安全的电池材料,以满足可再生能源的存储需求。同时,信息技术的进步也促使材料科学家随着人工智能(AI)技术的不断进步,在新材料研究中的应用已经开启一个全新的研究范式,成为超越传统研发模式的新质生产力。特别是在材料的
-
地球快速城市化和创造可持续生活环境的迫切需求,智能基础设施的概念已经成为未来希望的灯塔。根据联合国环境规划署(UNEP)的数据,随着发展中国家房地产市场的持续繁荣,预计2050年许多地区建筑面积将增加一倍以上。由此也可以预计,来自建筑物能源消耗将变得十分惊人,这将进一步加速了对智能建筑的需求。智能建筑的需求在当前全球能源和气候危机的背景下,智能建筑需求愈发显著。首先,智能建筑以其节能效率和能源利用率的特点成为关注焦点。通过先进的技术和自动化系统,智能建筑最大程度地减少能源消耗,降低能源成本,同时减少对环境
-
2024年4月20日,Rokid在杭州举行了以“好玩、好看、好上头”为主题的RokidOpenDay发布会。Rokid对外正式发布了新一代ARLite空间计算套装,分享了近期Rokid在AR开发者生态和数字化领域的进展和成果,并宣布了多项跨行业重磅合作。作为中国代表性的AR创新力量,Rokid正持续引导空间计算在中国全面普及及,让下一代消费电子能够够提前到来,普通人能够够体验并受益于科技创新的力量。有别于苹果VisionPro产品线,此次发布的RokidARLite空间计算套装基于OST光学透视原理,与现
-
向大家介绍一个最新的AIGC开源项目——AnimagineXL3.1。这个项目是动漫主题文本到图像模型的最新迭代,旨在为用户提供更加优化和强大的动漫图像生成体验。在AnimagineXL3.1中,开发团队着重优化了几个关键方面,以确保模型在性能和功能上达到新的高度。首先,他们扩展了训练数据,不仅包括了之前版本中的游戏角色数据,还加入许多其他知名动漫系列的数据纳入训练集中。这一举措丰富了模型的知识库,使其能够更全面地理解各种动漫风格和角色。AnimagineXL3.1引入了一组新的特殊标签和美学标签,以更好
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com。在日常活动中,人的运动经常引起衣服的附属运动(secondarymotionofclothes)并因此产生不同的衣服褶皱,而这需要对人体及衣服的几何、运动(人体姿态及速度动力学等)及外