-
1.腾讯全球数字生态大会定档腾讯宣布2024年腾讯全球数字生态大会将于9月5日至6日在深圳国际会展中心举行,主题为“智启新机,云驱增长”。2.焦点:AI等前沿技术助力产业增长腾讯云与智慧产业事业群CEO汤道生表示,大会将探讨AI大模型等前沿技术的新发展,探索数字化助力产业新增长的可行路径。3.大会内容:全方位展示产业数字化大会将全面展示腾讯云的核心产品、解决方案和最佳实践,呈现产业互联网的最新探索和实践方法。4.线下线上同步举行:设置多个板块大会将线下、线上同时举行,包括主峰会、主题专场、技术专题和智能互
-
首位华人诺奖得主李政道8月4日于美国旧金山逝世,享年98岁。李政道先生(Tsung-DaoLee)出生于1926年11月24日,是美籍华裔物理学家,因其在宇称不守恒、李杨定理、粒子物理、相对论重离子(RHIC)物理、非拓扑孤子和孤子星方面的工作而闻名。李政道曾任哥伦比亚大学名誉教授,1953年起执教,直到2012年退休。李政道和杨振宁同为首批华人诺贝尔奖得主。1957年,31岁的李政道与35岁的杨振宁因「对(弱相互作用中)宇称不守恒定律的研究以及由此导致有关基本粒子方面的许多发现」而共同获得诺贝尔物理学奖
-
偷懒才能更好地工作。Llama3.1刚刚发布,你是否已经尝试了呢?就算你的个人计算机是最近的顶尖配置,运行其中最小的8B版本可能也依然会有明显延迟。为了提升模型的推理效率,研究者想出了多种多样的方法,但其中很多都会让模型牺牲一些准确度。近日,苹果和MetaAI的一个研究团队提出了一种新方法,可在保证准确度不明显下降的同时,将Llama2预填充阶段的推理速度提升到原来的2倍以上,这或许能为Llama3.1的加速提供一些启发。他们把这种方法称为LazyLLM,即懒惰大型语言模型。论文标题:LazyLLM:Dy
-
在当前AI领域,大语言模型采用的主流架构是Transformer。不过,随着RWKV、Mamba等架构的陆续问世,出现了一个很明显的趋势:在语言建模困惑度方面与Transformer较量的循环大语言模型正在快速进入人们的视线。令人兴奋的是,这些架构在推理期间使用了恒定量的内存。不过,受制于有限的内存,循环语言模型(LM)无法记忆并使用长上下文中的所有信息,这导致了上下文学习(in-contextlearning,ICL)质量的不佳。因此,获得高效大语言模型的关键挑战在于选择存储或者丢弃哪些信息。在最近的论
-
编辑|萝卜皮蛋白质糖基化是糖基对蛋白质进行的一种翻译后修饰,在细胞的多种生理和病理功能中起着重要作用。糖蛋白质组学是在蛋白质组范围内研究蛋白质糖基化,利用液相色谱与串联质谱(MS/MS)联用技术获取糖基化位点、糖基化水平和糖结构的组合信息。然而,由于结构决定离子的出现有限,目前糖蛋白质组学的数据库搜索方法通常难以确定聚糖结构。虽然光谱搜索方法可以利用碎片强度来促进糖肽的结构鉴定,但是光谱库构建的困难阻碍了它们的应用。在最新的研究中,复旦大学的研究人员提出了DeepGP,一种基于Transformer和图神
-
GitHub推出的全新功能「GitHubModels」将有望加快AI工程师时代的到来。什么?大家熟悉的代码托管平台GitHub又进化了!该平台也开始提供AI大模型的Playgroud了。所有你能叫得上名字的业界流行大模型,包括微软的Phi-3、OpenAI的GPT-4o、Meta的Llama3.1、Cohere的CommandR+、MistralAI的MistralLarge,都可以在一个交互式沙盒中试用。在未来几个月,Github也将添加更多语言、视觉以及其他类型的模型。也就是说,这张图上的模型都可以「
-
编辑|KX生成式深度学习正在重塑药物设计。化学语言模型(CLM)以分子串的形式生成分子,对这一过程尤为重要。近日,来自荷兰埃因霍芬理工大学(EindhovenUniversityofTechnology)的研究人员将一种最新的深度学习架构(S4)引入到从头药物设计中。结构化状态空间序列(StructuredStateSpaceSequence,S4)模型在学习序列的全局属性方面表现卓越,那么S4能否推进从头设计的化学语言建模?为了给出答案,研究人员系统地在一系列药物发现任务上对S4与最先进的CLM进行了基
-
1.如今,管理层希望在任何AI提案中包含投资回报率(ROI)的计算。这种新方法带来了一些引人注目的好处:当项目仅旨在改进度量指标和流程时,无需创建新的ROI计算、进行传阅并让各方利益相关者达成一致,团队可以更快地开始工作并交付原型。利用现有的应用逻辑并使用相同或大部分相同的数据,可以缩短确保数据合规性和安全性的过程。从一开始就对应用设计及其附加值有更清晰的认识,可以缩短设计过程并减少每次代码提交后所需的更改数量。这种针对ROI的方法变更可能并不适用于每个AI项目,然而,许多企业发现,设计和证明全新AI应用
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com张颖峰:英飞流联合创始人,多年搜索、AI、Infra基础设施开发经历,目前正致力于下一代RAG核心产品建设。在RAG系统开发中,良好的Reranker模型处于必不可少的环节,也总是被拿来
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com该论文的作者均来自于华为诺亚实验室,第一作者为李文硕,通讯作者为王云鹤和陈醒濠。相关团队团队近年来在ICML、CVPR、NeurIPS、ICCV、ECCV等顶会上有多项代表性工作发表,在
-
AI图像和视频生成领域又加入了一个颇有实力的玩家。还记得今年3月底,从AI初创公司StabilityAI离职的研究科学家RobinRombach吗?作为开发出文生图模型StableDiffusion的两位主要作者之一,他于2022年加入StabilityAI。如今,在从StabilityAI离职近五个月后,RobinRombach发推宣布了自己创业的好消息!他成立了「BlackForestLabs」,旨在推进用于图像和视频的SOTA高质量生成式深度学习模型,并开放给尽可能多的人使用。团队成员由杰出的AI研
-
请注意,上述动图完全是由多张照片渲染出来的3D场景。人类很难发现它们的破绽。那让我们一起看看,这种场景是怎样实现的。网格和点是最常见的三维场景表示法,因为它们是显式的,非常适合基于GPU/CUDA的快速光栅化。相比之下,最新的神经辐射场(NeRF)方法建立在连续场景表征的基础上,通常使用体积光线渲染优化多层感知器(MLP),对捕捉到的场景进行新视角合成。虽然这些方法的连续性有助于优化,但渲染所需的随机取样成本很高,而且会产生噪声。来自法国蔚蓝海岸大学的研究者引入了一种新方法,能够结合这两种方法的优点:3D
-
论坛主题:智启文创,激发无限新质生产力论坛时间:7月6日9:30-11:40论坛地点:上海世博中心515会议室近年来,随着人工智能技术快速发展,各行各业在新技术的助力下迸发新动力。在“AI+文创”新质生产力的培育与发展中,上海积极落实数字中国建设部署,为数字文创和元宇宙新赛道顶层设计和战略布局、打造文创产业创新发展“核爆点”提供了新机遇。为弘扬中华文化,推动文创产业创新发展,搭建国内外文创领域的交流平台,本次“AI+文创发展论坛”应运而生。论坛邀请全球专家、学者、文创产业精英及行业领军人物齐聚一堂,共同探
-
你规定路线,Tora来生成相应轨迹的视频。目前,扩散模型能够生成多样化且高质量的图像或视频。此前,视频扩散模型采用U-Net架构,主要侧重于合成有限时长(通常约为两秒)的视频,并且分辨率和纵横比受到固定限制。Sora的出现打破了这一限制,其采用DiffusionTransformer(DiT)架构,不仅擅长制作10到60秒的高质量视频,而且还因其生成不同分辨率、各种纵横比、且遵守实际物理定律的能力而脱颖而出。可以说Sora是DiT架构最有利的证明,然而,基于Transformer的扩散模型在有效生成可控动
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com文章作者皆为来自剑桥大学语言技术实验室,一作为三年级博士生刘胤宏,导师为教授NigelCollier和EhsanShareghi。他的研究兴趣是大模型和文本评估,数据生成等。共同一作为二