-
7月25日,ChinaJoy高峰论坛CDEC在上海浦东嘉里大酒店举办,这场行业先锋对话围绕如何在人工智能时代重塑定位、抓住机遇、突破增长瓶颈展开。在会上,网易公司副总裁庞大智出席论坛并发表主题演讲。原文内容当越来越多AI技术走出实验室、正式“上岗”开工,成为当下必不可少的新质生产力,庞大智表示,游戏行业一直是公认的AI技术最好的试验田,也是最早感知、适应AI冲击的前哨。行业要进一步考虑如何充分激发AI潜力,与更多产业、甚至全社会共享AI红利。针对如何激活“AI+游戏”潜能这一行业重要命
-
1.第32届ACM国际多媒体学术会议(ACMInternationalConferenceonMultimedia,简称ACMMM)公布论文接收结果,网易伏羲最新研究成果《SelectionandReconstructionofKeyLocals:ANovelSpecificDomainImage-TextRetrievalMethod》入选。该论文研究方向涉及视觉语言预训练(VLP)、跨模态图文检索(CMITR)等领域。此次入选标志着网易伏羲实验室多模态能力再受国际认
-
INDUS以南天星座命名,是一套全面的大型语言模型,支持五个科学领域。(来源:NASA)编辑|KX在大量数据上训练的大型语言模型(LLM)在自然语言理解和生成任务上表现出色。大多数流行的LLM使用Wikipedia等通用语料库进行训练,但词汇的分布变化导致特定领域的性能不佳。受此启发,NASA与IBM合作开发了INDUS,这是一套全面的LLM,专为地球科学、生物学、物理学、太阳物理学、行星科学和天体物理学领域量身定制,并使用从不同数据源的精选科学语料库进行训练。INDUS包含两类模型:编码器和句子Tran
-
编辑:KX空间转录组学与多组学数据整合空间转录组学作为单细胞转录组学后的重大进展,使得多组学数据的整合至关重要。SpatialGlue:具有双注意力机制的图神经网络模型来自新加坡科技研究局(A*STAR)、华大基因和上海交通大学医学院附属仁济医院的研究团队提出了一种名为SpatialGlue的图神经网络模型,该模型通过双注意力机制整合多组学数据,以空间感知的方式揭示组织样本的组织学相关结构。SpatialGlue的优势SpatialGlue能够将多种数据模态与其各自的空间背景相结合。与其他方法相比,Spa
-
近日,智加科技团队论文《DualBEV:UnifyingDualVeiwTransformationwithProbabilisticCorrespondences》入选欧洲计算机视觉国际会议(ECCV,EuropeanConferenceonComputerVision),ECCV是计算机视觉领域最具影响力和权威性的国际会议之一,与国际计算机视觉大会(ICCV)和计算机视觉与模式识别会议(CVPR)齐名,被誉为计算机视觉领域的“三大顶会”之一。ECCV每两年举办一次,汇聚了全球顶
-
快准备好你的GPU!Llama3.1终于现身了,不过出处却不是Meta官方。今日,Reddit上新版Llama大模型泄露的消息遭到了疯传,除了基础模型,还包括8B、70B和最大参数的405B的基准测试结果。下图为Llama3.1各版本与OpenAIGPT-4o、Llama38B/70B的比较结果。可以看到,即使是70B的版本,也在多项基准上超过了GPT-4o。图源:https://x.com/mattshumer_/status/1815444612414087294显然,3.1版本的8B和70B模型是由
-
人工智能的发展速度可能超乎你的想象。自GPT-4将多模态技术引入公众视野以来,多模态大模型进入快速发展阶段,逐渐从单纯的模型研发转向垂直领域的探索和应用,与各行各业深度融合。在界面交互领域,谷歌、苹果等国际科技巨头纷纷投入UI多模态大模型研发,这被视为手机AI革命的必经之路。在此背景下,国内首个UI大模型横空出世。8月17日,在IXDC2024国际体验设计大会上,AI时代设计工具Motiff妙多推出了其自主研发的UI多模态大模型——Motiff妙多大模型。这是全球首个由UI设计工具
-
人类的教育方式,对大模型而言也很适用。养育孩子时,古往今来人们都会谈到一种重要方法:以身作则。也就是让自己成为孩子模仿学习的范例,而不是单纯地告诉他们应该怎么做。在训练大语言模型(LLM)时,我们或许也能采用这样的方法——向模型进行演示。近日,斯坦福大学杨笛一团队提出了一种新框架DITTO,可通过少量演示(用户提供的期望行为示例)来将LLM与特定设置对齐。这些示例可以从用户现有的交互日志获取,也能通过直接编辑LLM的输出得到。这样就可以让模型针对不同的用户和任务高效地理解并对齐用户
-
`编辑|KX近日,礼来公司与人工智能驱动药物发现的GeneticLeap达成一项人工智能药物研发协议,该协议价值高达4.09亿美元。总部位于纽约的GeneticLeap专注于在AI和RNA基因医学领域进行创新,旨在支持RNA靶向药物的发现。其AI平台可用于发现新靶点,并找到方法以对抗经过验证但无法用药的靶点。此前,安斯泰来(Astellas)制药公司与GeneticLeap合作,利用该平台在2022年寻找针对未公开的肿瘤靶点的RNA靶向小分子。现在,礼来公司已加入GeneticLeap合作伙伴名单。并签署
-
2024年东京奥运会即将开幕。7月26日,智能AI助手豆包宣布携手跳水奥运冠军吴敏霞、羽毛球奥运冠军林丹、体育解说员黄健翔及体育解说员刘语熙共同打造专属奥运智能体,用户可以在豆包App中和他们畅聊奥运话题。同时,豆包网页版也将上线“AI带你解读奥运”专区,为用户提供奥运新闻早晚报、赛事回放、AI解说等内容。明星智能体据介绍,上述明星智能体不仅在对话语气上模拟了几人的性格特征,同时也获得了声音授权。用户可以随时在豆包中体验与这些专业人士交流奥运赛事的乐趣:黄健翔:共同探讨足球比赛的战术布局和精彩进球林丹:讲
-
上海交大&上海AILab发布178页GPT-4V医疗案例测评,首次全面揭秘GPT-4V医疗领域视觉性能ArXiv链接:https://arxiv.org/abs/2310.09909其他论文下载地址:百度云:https://pan.baidu.com/s/11xV8MkUfmF3emJQH9awtcw?pwd=krk2GoogleDrive:https://drive.google.com/file/d/1HPvPDwhgpOwxi2sYH3_xrcaoXjBGWhK9/view?usp=sharing研
-
AI视频圈正「互扯头花」。国外的Luma、Runway,国内的快手可灵、字节即梦、智谱清影……你方唱罢我登场。无一例外,它们对标的都是那个传说中的Sora。其实,说起Sora全球挑战者,生数科技的Vidu少不了。早在三个月前,国内外视频生成领域还一片「沉寂」之时,生数科技突然曝出自家最新视频大模型Vidu的宣传视频,凭借其生动逼真、不输Sora的效果,惊艳了一众网友。就在今天,Vidu正式上线。无需申请,只要有个邮箱,就能上手体验。(Vidu官网链接:www.vidu.stud
-
硬件发展速度跟不上AI需求,就需要精妙的架构和算法。根据摩尔定律,计算机的速度平均每两年就会翻一倍,但深度学习的发展速度还要更快,如图1和2所示。可以看到,AI对算力的需求每年都以10倍幅度增长,而硬件速度每两年增长3倍、DRAM带宽增长1.6倍、互连带宽则仅有1.4倍。而大模型是大数据+大计算的产物,其参数量可达千亿乃至万亿规模,需要成千上万台GPU才能有效完成训练。这些实际情况提升了人们对高性能计算(HPC)的需求。为了获得更多计算资源,人们不得不扩展更多计算节点。这就导致构建AI基础设施的成本不断激
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com近年,短视频生态的赛道迅猛崛起,围绕短视频而生的创作编辑工具在不断涌现,美图公司旗下专业手机视频编辑工具——Wink,凭借独创的视频画质修复能力独占鳌头,海内外用
-
AI竞赛正以前所未有的速度加速,继Meta昨天推出其新的开源Llama3.1模型之后,法国AI初创公司MistralAI也加入了竞争。刚刚,MistralAI宣布其旗舰开源模型的下一代产品:MistralLarge2,该模型拥有1230亿个参数,在代码生成、数学、推理等方面与OpenAI和Meta的最新尖端模型不相上下。紧随Llama3.1405B之后,MistralLarge2的发布让开源大模型的赛道一下子热闹起来,而这一模型的特点是——「足够大」。具体来说,虽然MistralL