-
多层感知器(MLP)是一种常用的深度学习模型,用于分类、回归等任务。然而,MLP容易出现过拟合问题,即在训练集上表现良好但在测试集上表现不佳。为了解决这个问题,研究人员提出了多种正则化方法,其中最常用的是dropout。通过在训练过程中随机丢弃部分神经元的输出,dropout可以减少神经网络的复杂性,从而减少过拟合的风险。这种方法已经被广泛应用于深度学习模型中,取得了显著的效果改善。Dropout是一种用于神经网络正则化的技术,最初由Srivastava等人在2014年提出。该方法通过随机删除神经元来减少
-
最近,一支计算机科学家团队研发了一种更灵活、更具弹性的机器学习模型,它们具有周期性遗忘已知信息的能力,这是现有大型语言模型所不具备的特点。实测表明,在很多情况下,“忘却法”的训练效率很高,忘却型模型表现也会更好。韩国基础科学研究院(InstituteforBasicScience)的AI工程师JeaKwon说,新研究意味着AI领域取得明显进步。“忘却法”训练效率很高目前主流的AI语言引擎大多采用人工神经网络技术。这种网络结构中的每个“神经元”实际上是一个数学函数,它们之间相互连接,接收和传递信息,通过多层
-
如果你有被Sora生成的视频震撼到,那你就已经见识过扩散模型在视觉生成方面的巨大潜力。当然,扩散模型的潜力并不止步于此,它在许多其它不同领域也有着让人期待的应用前景,更多案例可参阅本站不久前的报道《爆火Sora背后的技术,一文综述扩散模型的最新发展方向》。最近,由新加坡国立大学的尤洋团队、加州大学伯克利分校以及MetaAIResearch所进行的研究发现了扩散模型的一个新应用:用于生成神经网络的模型参数。论文地址:https://arxiv.org/pdf/2402.13144.pdf项目地址:https
-
Ollama是一款超级实用的工具,让你能够在本地轻松运行Llama2、Mistral、Gemma等开源模型。本文我将介绍如何使用Ollama实现对文本的向量化处理。如果你本地还没有安装Ollama,可以阅读这篇文章。本文我们将使用nomic-embed-text[2]模型。它是一种文本编码器,在短的上下文和长的上下文任务上,性能超越了OpenAItext-embedding-ada-002和text-embedding-3-small。启动nomic-embed-text服务当你已经成功安装好ollama
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文由上海人工智能实验室联合大连理工大学和中国科技大学完成。通讯作者:邵婧,博士毕业于香港中文大学多媒体实验室MMLab,现任浦江国家实验室大模型安全团队负责人,牵头研究大模型安全可信评
-
2024年6月21日,小冰公司与AIoT头部企业视美泰宣布达成战略合作,共同推出ShiMeta数字人解决方案。双方联合打造多种形态的数字人智能交互大屏终端,将小冰AI大模型、数字人技术与视美泰丰富的硬件商业生态相融合,让数字人走入各类行业场景,为千行百业注入全新的生产力,提升用户体验和服务效率,带来更多智能化变革。小冰×视美泰:丰富的硬件商业生态方案将小冰大模型以及神经网络渲染、超级自然语音等先进数字人技术,与视美泰高性能主板、高清摄像头、麦克风阵列、设备管理平台等进行了深入整合,实现大屏终端
-
虽然RLHF的初衷是用来控制人工智能(AI),但实际上它可能会帮助AI欺骗人类。语言模型(LM)可能会产生人类难以察觉的错误,尤其是在任务复杂的情况下。作为最近流行的后训练方法RLHF,可能会加剧这个问题:为了获得更高的奖励,LM可能会更好地说服人类认为它们是正确的,即使它们是错误的。这对人类评估者来说是一个巨大的挑战,因为人类想要发现LM输出中那些似乎正确的细微错误非常困难。在正确的答案和看起来正确的答案之间出现了差距(gap)。这种差距可能会导致RLHF奖励黑客攻击:为了获得更高的奖励,LM可以学会说
-
尚太科技于2022年11月26日审议通过了《关于公司全资子公司签署投资合作协议书暨投资建设年产30万吨锂离子电池负极材料一体化生产项目的议案》,尚太科技全资子公司山西尚太与山西省晋中市昔阳县人民政府签署《投资合作协议书》,山西尚太拟在昔阳县投资建设年产30万吨锂离子电池负极材料一体化项目,投资金额约120亿元。1月11日,尚太科技发布公告称,因原项目土地条件、市场竞争环境等发生变化,公司于1月9日审议通过《关于全资子公司签署<投资协议书>暨投资项目调整的议案》,调整拟建设土地范围,选择具备平整
-
国内领先的科创板企业和辉光电近日宣布,计划在香港联合交易所上市,发行H股。此举旨在加速国际化进程,增强海外融资能力,并提升高端AMOLED面板的产能。和辉光电成立于2012年12月,致力于中小尺寸AMOLED半导体显示面板的研发、生产和销售。公司于2021年5月登陆科创板,目前市值已突破300亿元。和辉光电曾建成国内首条AMOLED量产线,打破了该领域长期被国外企业垄断的局面。尽管公司曾连续亏损,但近年来业绩显著改善。2024年三季度报告显示,公司净利润亏损大幅收窄,主要得益于成本控制和产能利用率的提
-
奥比中光2024年度业绩预告:营收增长显著,亏损大幅收窄奥比中光近日发布2024年度业绩预告,预计全年营业收入约56亿元,同比增长约55.55%,增幅显著。然而,公司预计净利润仍为亏损状态,约为-6亿元,但同比减少亏损78.25%;扣除非经常性损益后净利润预计为-11.6亿元,同比减少亏损64.19%。与2024年同期相比,公司营业收入为36.0059亿元,净利润为-27.58848亿元,扣除非经常性损益后净利润为-32.38887亿元。奥比中光表示,业绩变动主要源于以下因素:自2013年
-
科大讯飞携手华为及合肥市大数据资产运营有限公司,共同打造的国产超大规模智算平台“飞星二号”目前正在建设中。公司近期在互动平台上回应相关提问时表示,暂无其他信息需要披露。“飞星二号”是一个强大的智能计算平台,旨在支持各种人工智能模型和算法的快速部署和运行,并通过规模化智算集群提升计算效率。据民生证券分析,国内算力市场持续高增长,尤其是在运营商和政府等领域。尤其考虑到中国移动等大型运营商计划采购超过1.7万台AI服务器,市场需求强劲。“飞星二号”的建成投用,将进一步推动AI算力领域的市场讨论。未来,国产算力发
-
2024年全球平板电脑市场强劲复苏,Canalys报告显示出货量增长显著。Canalys最新报告显示,2024年第四季度全球平板电脑出货量同比增长5.6%,达到3990万台,全年总出货量达1.476亿台,同比增长9.2%。除北美市场外,全球其他地区均实现增长,展现出市场稳健复苏的积极态势。中国厂商在2024年平板市场表现突出,小米增长尤为迅速,年增长率高达73%,超越亚马逊,跃居全球第五。华为也实现29%的增长,排名升至全球第三。联想以1000万台的出货量位列第四,同比增长12%。苹果凭借新款iPa
-
显示面板厂商工厂利用率持续攀升,2025年一季度有望突破80%!市场调研机构Omdia最新报告显示,2024年第四季度,显示面板厂商积极提升产能利用率,计划利用率从11月底的77%提升至12月底的79%,并进一步上调2025年一季度计划至80%以上。Omdia显示研究首席分析师AlexKang分析指出,这一趋势主要源于中国大陆政府“以旧换新”补贴政策刺激的电视面板需求增长。为抢占市场份额,中国大陆主要电视厂商纷纷加大电视面板采购力度。此外,潜在的美国关税风险也推高了液晶电视面板需求。部分中国大陆电
-
东风猛士917智能座舱即将搭载DeepSeek-R1模型,引领汽车行业AI智能化新潮流!据悉,猛士科技将于2025年4月北京车展前,通过OTA升级,率先在猛士917和蛟龙战甲等车型上推出这项技术。此次合作将显著提升猛士车型的座舱智能化水平。依托DeepSeek-R1模型强大的AI能力,语音交互将实现质的飞跃:响应速度将从秒级提升至毫秒级,语义理解和应答更加自然流畅,并新增丰富的越野场景语音指令。DeepSeek-R1作为一款最新开源的AI模型,其技术突破令人瞩目。它采用纯深度学习方法,赋予AI自发
-
臻镭科技发布2024年度业绩快报:营收增长,利润下滑臻镭科技近日发布2024年度业绩快报,显示公司营业收入同比增长8.10%,达到30,354.24万元。然而,归属于母公司所有者的净利润却同比下降74.98%,仅为1,813.1万元;扣除非经常性损益的净利润更是同比下降106.74%,为-431.03万元。业绩变动主要源于以下几个方面:研发投入增加:为提升产品竞争力,公司持续加大研发投入,研发费用显著上升。信用减值损失及存货减值准备增加:下游客户回款缓慢导致信用减值损失计提增加,同时公司