-
同样是图生视频,PaintsUndo走出了不一样的路线。ControlNet作者LvminZhang又开始整活了!这次瞄准绘画领域。新项目PaintsUndo刚上线不久,就收获1.4kstar(还在疯狂涨)。项目地址:https://github.com/lllyasviel/Paints-UNDO通过该项目,用户输入一张静态图像,PaintsUndo就能自动帮你生成整个绘画的全过程视频,从线稿到成品都有迹可循。绘制过程,线条变化多端甚是神奇,最终视频结果和原图像非常相似:我们再来看一个完整的绘画过程。P
-
不管你来自哪个城市,相信在你的记忆中,都有自己的「家乡话」:吴语柔软细腻、关中方言质朴厚重、四川方言幽默诙谐、粤语古雅潇洒……某种意义上说,方言不只是一种语言习惯,也是一种情感连接、一种文化认同。我们「上网冲浪」遇到的新鲜词汇中,有不少就是来自各地方言。当然,有些时候,方言也是一种交流「壁垒」。在现实生活中,我们经常会看到方言导致的「鸡同鸭讲」,比如这个:如果你关注最近科技圈的动态就会知道,当前的AI语音助手已经能达到「实时回复」的水准,甚至比人类反应还快。而且,AI已经能够充
-
近来,《自然》子刊收录了一项能找出神经网络在哪里出错的研究成果。研究团队提供了一种利用拓扑学描述神经网络的推断结果与其分类之间关系的可视化方法。这项成果能够帮助研究人员推断神经网络推理过程中发生混淆的具体情况,让人工智能系统更加透明。研究人员揭示神经网络推理中的故障点神经网络尖峰揭示推理错误:研究发现神经网络推理中存在数据图尖峰,这些尖峰与判断模糊和产生错误有关。观察尖峰有助于发现人工智能系统中的故障点。神经网络推理过程缺乏透明性:神经网络擅长解决问题,但其推理过程不透明,引发对可靠性的担忧。新研究提供了
-
编辑|白菜叶许多自然和人造系统都容易发生关键转变——动态方面的突然且可能具有破坏性的变化。深度学习分类器可以通过从大型模拟训练数据集中学习分叉的通用特征,为关键转变提供预警信号。到目前为止,分类器仅被训练来预测连续时间分岔,忽略了离散时间分岔所特有的丰富动态。在这里,麦吉尔大学(McGillUniversity)ThomasM.Bury的研究团队训练一个深度学习分类器,为余维一的五个局部离散时间分岔提供预警信号。他们使用生理学、经济学和生态学中使用的离散时间模型的模拟数据以及经历倍周期分岔的自发跳动的鸡心
-
这是量化投资最好的时代,行业认可度不断攀升,优秀人才群贤毕至,更多的技术玩家深入探索无人之境……这也是量化投资「最坏」的时代,更激烈的竞争法则和残酷的淘汰机制,意味着只有不断翻越层层技术高峰,才能「一览众山小」。2023年,踏入「万亿」时代的量化私募行业开启了以硬件战争、算力竞赛、天才博弈著称的内卷之争。从野蛮生长到精耕细作,如何面对技术与智力比拼不断升级的行业生态?在国内市场稳步走过十个年头的宽德投资,正以自身的经验破题。让我们一起来看看宽德人给出的答案。以下视频来源于:宽德
-
9月2日下午,2023中国电子商务大会在北京国家会议中心开幕。本届大会由商务部、北京市人民政府共同主办,商务部电子商务和信息化司、北京市商务局承办,亿邦动力、北京电子商务协会执行。来自全国24个省市自治区,超过60个各级商务主管部门,以及北京市相关部门、各区商务局、国内外电商企业、媒体界嘉宾共计500余人参加大会开幕式。会上,“丝路电商”合作伙伴国代表,阿根廷外交、国际贸易和宗教事务部多边与双边经济谈判副国务秘书拉米罗·奥尔多基,巴基斯坦驻华大使莫因·哈克,分别带来主题演讲,围绕“一带一路”国家在电子商务
-
9月2日下午,2023中国电子商务大会在北京国家会议中心开幕。本届大会由商务部、北京市人民政府共同主办,商务部电子商务和信息化司、北京市商务局承办,亿邦动力、北京电子商务协会执行。来自全国24个省市自治区,超过60个各级商务主管部门,以及北京市相关部门、各区商务局、国内外电商企业、媒体界嘉宾共计500余人参加大会开幕式。会上,“丝路电商”合作伙伴国代表,阿根廷外交、国际贸易和宗教事务部多边与双边经济谈判副国务秘书拉米罗·奥尔多基,巴基斯坦驻华大使莫因·哈克,分别带来主题演讲,围绕“一带一路”国家在电子商务
-
1.蛋白质相互作用的重要性蛋白质是生命的基石,参与几乎所有生物过程。了解蛋白质如何相互作用对于解释细胞功能的复杂性至关重要。2.新方法:配对相互作用的蛋白质序列洛桑联邦理工学院(EPFL)的Anne-FlorenceBitbol团队提出了一种配对相互作用的蛋白质序列的方法。该方法利用了在多个序列比对上训练的蛋白质语言模型的强大功能。3.方法优点该方法对于小型数据集表现良好,并且可以通过监督方法改进蛋白质复合物的结构预测。4.研究成果发表该研究以「Pairinginteractingproteinseque
-
编辑|萝卜皮OpenAI的GPT和MetaAI的Llama等大型语言模型(LLM)因其在化学信息学领域的潜力而日益受到认可,特别是在理解简化分子输入行输入系统(SMILES)方面。这些LLM还能够将SMILES字符串解码为矢量表示。加拿大温莎大学(UniversityofWindsor)的研究人员比较了GPT和Llama与SMILES上的预训练模型在下游任务中嵌入SMILES字符串的性能,重点关注两个关键应用:分子特性预测和药物-药物相互作用预测。该研究以「Canlargelanguagemodelsun
-
作者|田宇编辑|白菜叶近年来,人工智能模型的公平性问题受到了越来越多的关注,尤其是在医学领域,因为医学模型的公平性对人们的健康和生命至关重要。高质量的医学公平性数据集对促进公平学习研究非常必要。现有的医学公平性数据集都是针对分类任务的,而没有可用于医学分割的公平性数据集,但是医学分割与分类一样都是非常重要的医学AI任务,在某些场景分割甚至优于分类,因为它能够提供待临床医生评估的器官异常的详细空间信息。在最新的研究中,哈佛大学(HarvardUniversity)的Harvard-Ophthalmology
-
大语言模型(LLM)被越来越多应用于各种领域。然而,它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则:每个词(token)的生成都需要进行一次前向传播,需要访问数十亿至数千亿参数的LLM。这导致传统自回归解码的速度较慢。近日,滑铁卢大学、加拿大向量研究院、北京大学等机构联合发布EAGLE,旨在提升大语言模型的推理速度,同时保证模型输出文本的分布一致。这种方法外推LLM的第二顶层特征向量,能够显著提升生成效率。技术报告:https://sites.google.com/view/eagl
-
上海交大&上海AILab发布178页GPT-4V医疗案例测评,首次全面揭秘GPT-4V医疗领域视觉性能ArXiv链接:https://arxiv.org/abs/2310.09909其他论文下载地址:百度云:https://pan.baidu.com/s/11xV8MkUfmF3emJQH9awtcw?pwd=krk2GoogleDrive:https://drive.google.com/file/d/1HPvPDwhgpOwxi2sYH3_xrcaoXjBGWhK9/view?usp=sharing研
-
上海交大&上海AILab发布178页GPT-4V医疗案例测评,首次全面揭秘GPT-4V医疗领域视觉性能。在大型基础模型的推动下,人工智能的发展近来取得了巨大进步,尤其是OpenAI的GPT-4,其在问答、知识方面展现出的强大能力点亮了AI领域的尤里卡时刻,引起了公众的普遍关注。GPT-4V(ision)是OpenAI最新的多模态基础模型。相较于GPT-4,它增加了图像与语音的输入能力。该研究则旨在通过案例分析评估GPT-4V(ision)在多模态医疗诊断领域的性能,一共展现并分析共计了128(92个放射学
-
想象一下,如果机器人能够听懂你的需求,并努力满足,是不是很美好呢?如果想让机器人帮助你,你通常需要下达一个较为精准的指令,但指令在实际中的实现效果不一定理想。如果考虑真实环境,当要求机器人找某个特定的物品时,这个物品不一定真的存在当前的环境内,机器人无论如何也找不到;但是环境当中是不是可能存在一个其他物品,它和用户要求的物品有类似的功能,也能满足用户的需求呢?这就是用“需求”作为任务指令的好处了。近日,北京大学董豪团队提出了一个新的导航任务——需求驱动导航(
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com3D生成是生成式人工智能和计算机图形学领域最引人注目的话题之一,符合影视、游戏标准的3D生成尤其受产业界关注。在生产流程中,一般品类的3D资产往往通过手工建模或者扫描的方式制作。但作为3