-
Replicateisacloud-basedmachinelearningplatform.ItenablesuserstodirectlyrunmachinelearningmodelsusingcloudAPIs,eliminatingtheneedtounderstandcomplexmachinelearningmodelarchitectures.在Python或JupyterNotebook中,允许用户运行模型并在云端部署和优化模型。您可以使用它来运行其他人发布的开源模型,也可以打包并发布自
-
2024年2月28日,StabilityAI在其官方社交账号上宣布与领先的text-to-video公司MorphAI达成合作,双方基于各自的模型优势,共同推出了一款all-in-one(一体式AI视频创作)的制作工具——MorphStudio。该工具将颠覆传统视频制作流程,具备了让创作者能够在一个界面中完成生成、剪辑和后期等的便捷功能,支持创作者调用AI模型选择每一个镜头并达到最佳效果。较传统视频制作流程而言,该工具能够极大的帮助创作者缩短创作时间,降低创作成本。与此同时,在双方的创作者社区中,每一个创
-
生成式人工智能(GenAI)是一项备受关注的新技术,已在各个业务领域如营销和销售中得到广泛应用。它通过数据分析,提高了运营效率和供应链弹性,使企业更具竞争力。GenAI的出现为企业带来了更多的发展机遇,帮助它们更好地应对市场挑战和变化,实现更高效的业务管理和创新发展。什么是供应链中的生成式人工智能在消费者的使用情境下,GenAI流程包括通过在文本、图像或视频字段中输入命令或问题来启动人工智能生成新内容的过程。通常,GenAI模型是基于大规模数据集进行训练的,当用户输入新数据时,应用程序会结合这些新数据和之
-
从2023年11月起,Grok首次亮相以来,马斯克的xAI正在大模型领域不断取得进步,向OpenAI等先行者发起进攻。在Grok-1开源后不到一个月,xAI的首个多模态模型就问世了。昨天,xAI推出了Grok-1.5V,该模型不仅能理解文本,还能处理文档、图表、截图和照片中的内容。Grok-1.5V是一种多模态模型,能够在许多领域展现出优雅的表现,从多学科推理到理解文档、科学图表、截图和照片等。xAI还表明,在接下来的几个月里,预计在图像、音频和视频等各种模态上显示出更高的模型能力。我们看到了Grok-1
-
过去的图像生成模型经常因为主要呈现白人形象而受到批评,而谷歌的Gemini模型则因为极端的矫枉过正而陷入困境。它的生成图像结果变得过分谨慎,与历史事实出现显著偏差,令用户感到惊讶。谷歌声称,该模型的谨慎程度超出了开发者的预期。这种谨慎不仅体现在生成的图像中,还表现在通常将一些提示视为敏感提示,进而拒绝提供答案。在这个问题持续引起关注的时候,如何在安全性和可用性之间取得平衡成为了Meta面临的一个巨大挑战。LLaMA2在开源领域被视为一位"强中手",也成为了Meta的明星模型,一经推出就改变了大型模型的局面
-
根据传统观念,驱动式攻击被定义为从受损网站自动下载恶意文件而无需用户交互。然而,在报告期间审查的大多数情况中,都涉及用户操作——在超过30%的事件中促进了初步访问。威胁行为者用AI自动化攻击在主要的网络犯罪论坛上,使用人工智能加速这些攻击正受到越来越多的关注,对武器化这项技术的兴趣也在增长。研究人员在这些网站的专业AI和机器学习部分发现了犯罪分子对主流聊天机器人的替代选择,如FraudGPT和WormGPT,并暗示使用这些选项开发简单恶意软件和分布式拒绝服务(DDoS)查询。AI系统现在可以使用样本复制声
-
自从大模型火爆出圈以后,人们对压缩大模型的愿望从未消减。这是因为,虽然大模型在很多方面表现出优秀的能力,但高昂的的部署代价极大提升了它的使用门槛。这种代价主要来自于空间占用和计算量。「模型量化」通过把大模型的参数转化为低位宽的表示,进而节省空间占用。目前,主流方法可以在几乎不损失模型性能的情况下把已有模型压缩至4bit。然而,低于3bit的量化像一堵不可逾越的高墙,让研究人员望而生畏。图1:量化模型的困惑度在2bit时迅速上升近期,一篇由清华大学、哈尔滨工业大学合作发表在arXiv上的论文为突破这一阻碍带
-
近日,面壁智能完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东继续跟投支持。本轮融资完成后,面壁智能将进一步推进优秀人才引入,加固大模型展开的基础算力与数据基础,持续引领“高效大模型”路线,推动大模型高效训练,快速应用落地。本轮由光源资本担任独家财务顾问。基于扎实的原创性AI技术基础,面壁智能是世界范围内对“高效大模型”探索最为前列的大模型团队之一,目前已完成了贯彻高效训练、高效落地与高效推理的大模型全栈技术生产线布局。核心研发团队脱胎于清华NLP实验室,
-
大家好,我是风筝两年前,将音视频文件转换为文字内容的需求难以实现,但是如今只需几分钟便可轻松解决。据说一些公司为了获取训练数据,已经对抖音、快手等短视频平台上的视频进行了全面爬取,然后将视频中的音频提取出来转换成文本形式,用作大数据模型的训练语料。如果您需要将视频或音频文件转换为文字,可以尝试今天提供的这个开源解决方案。例如,可以搜索影视节目的对话出现的具体时间点。话不多说,进入正题。Whisper这个方案就是OpenAI开源的Whisper,当然是用Python写的了,只需要简单安装几个包,然后几行代码
-
AniPortrait模型是开源的,可以自由畅玩。「小破站鬼畜区的新质生产力工具。」近日,腾讯开源发布的一个新项目在推上获得了如此评价。这个项目是AniPortrait,其可基于音频和一张参考图像生成高质量动画人像。话不说多,我们先看看可能会被律师函警告的demo:动漫图像也能轻松开口说话:该项目刚上线几天,就已经收获了广泛好评:GitHubStar数已经突破2800。下面我们来看看AniPortrait的创新之处。论文标题:AniPortrait:Audio-DrivenSynthesisofPhoto
-
如果足球战术都是AI设计的,那很难想象其他事情有什么不可以。足球界备受瞩目的年轻教练不再是勒沃库森的阿隆索、兰斯的斯蒂尔或博洛尼亚的莫塔,而可能是一位AI教练,来自于谷歌DeepMind。球迷们可能还记得,2019年5月8日,利物浦在欧洲冠军联赛半决赛中创造了历史性的逆转。最让人难忘的时刻是下半场,阿诺德进行了一次出其不意的角球传球,奥里吉打进了一球,这个进球可能是利物浦历史上最为伟大的一次。在那场比赛中,利物浦完成了令人难以置信的翻盘,被称为"安菲尔德奇迹之夜",克洛普的战术哲学也深受球迷喜爱。在赛后的
-
微调无需更新全部模型参数,这种方法只需更新不到1%的参数。众所周知,大模型的训练成本很高,但其实对预训练后的模型进行微调也需要一定的成本,还好我们已经有了(IA)³或LORA等一些参数高效型微调(PEFT)方法。近日,AI创业公司Cohere更进一步,将混合专家方法与PEFT组合,实现了极其参数高效的微调——即使是在未曾见过的任务上,这种新方法只需更新不到1%的参数,就能实现与完全微调方法相当的性能。Cohere公司在攻克这些挑战上迈出了重要一步,提出了一个新框架&mda
-
美国警察最新公布一则案件:波士顿动力机器狗首次被枪杀阵亡。官方图显示,机器狗身上有多处枪伤,金属外壳凹陷,油漆脱落,已经无法继续使用。对于机器狗此番牺牲,警方也给予了高度评价:这是在为人类执法伙伴挡住了子弹。波士顿动力机器狗首次被枪杀马萨诸塞州警方详细地披露了案件细节。那是一个平常的周三下午,一名嫌疑人持枪藏在一处住宅内。警察随后派出一只名为Roscoe的机器狗和两台PacBot510履带式机器人,以协助搜捕。在人类士兵遥控操作下,Roscoe对房屋进行了地毯式搜索。结果就在机器狗清查完地下室一个壁橱,然
-
在目前的模型训练范式中,偏好数据的的获取与使用已经成为了不可或缺的一环。在训练中,偏好数据通常被用作对齐(alignment)时的训练优化目标,如基于人类或AI反馈的强化学习(RLHF/RLAIF)或者直接偏好优化(DPO),而在模型评估中,由于任务的复杂性且通常没有标准答案,则通常直接以人类标注者或高性能大模型(LLM-as-a-Judge)的偏好标注作为评判标准。尽管上述对偏好数据的应用已经取得了广泛的成效,但对偏好本身则缺乏充足的研究,这很大程度上阻碍了对更可信AI系统的构建。为此,上海交通大学生成
-
译者|陈峻审校|重楼如您所见,当前正在发生的这场人工智能(AI)革命已经席卷了各行各业。其中给人最直观的感受便是,在基于交互式人机对话的基础上,AI算法不但可以生成类似人类语言的文本,而且能够根据一个(组)单词创建图像和视频。不过,这些人工智能工具(尤其是像DALL-E、Midjourney等从文本到图像的生成器)所使用的训练数据,往往来自受版权保护的数据源。在数字领域中,阻止人工智能生成工具利用受版权保护的图像进行训练是具有挑战性的任务。各行各业的艺术家们一直在不同层面上努力维护他们的作品,以免受人工智