-
IT之家于12月28日发布消息,优酷视频宣布推出了一项名为“AI搜片”的全新功能,据称是全网首个基于人工智能的对话式影视搜索引擎。据介绍,该功能声称它可以涵盖全网上百万部影视剧的实际信息,并融合了数以万计的文娱相关知识词条。它能够通过多轮对话实现模糊搜索、影视问答、剧情检索等功能,而且不需要用户提供具体问题就能完成任务。官方还表示,该功能不仅可以通过模糊、口语化的提问获取准确的影视信息,还能与AI进行全网影视知识的交流。在IT之家的优酷App中,我们可以通过点击搜索栏来进行搜索。而如果想要进入对话页面,则
-
混淆矩阵是一种评估模式,帮助机器学习工程师更了解模型性能。本文以一个二元类不平衡数据集为例,测试集由60个正类样本和40个负类样本组成,用于评估机器学习模型。二元类数据集仅有两个不同类别的数据,可简单命名为“正面”和“负面”类别。现在,要完全理解这个二分类问题的混淆矩阵,我们首先需要熟悉以下术语:TruePositive(TP)是指属于正类的样本被正确分类。TrueNegative(TN)是指属于负类的样本被正确分类。FalsePositive(FP)是指属于阴性类的样本被错误地分类为属于阳性类。Fals
-
交叉验证是一种常用的机器学习模型性能评估方法。它将数据集划分为多个互不重叠的子集,其中一部分作为训练集,其余部分作为测试集。通过多次模型训练和测试,得到模型的平均性能作为泛化性能的估计值。交叉验证能够更准确地评估模型的泛化能力,避免过拟合或欠拟合的问题。常用的交叉验证方法有以下几种:1.简单交叉验证通常,我们将数据集分为训练集和测试集,其中训练集占总数据的70%到80%,剩下的数据作为测试集。使用训练集来训练模型,然后使用测试集来评估模型的性能。这种方法的一个缺点是,对数据集的分割方式非常敏感。如果训练集
-
大模型的纯文本方向,已经卷到头了?昨晚,OpenAI最大的竞争对手Anthropic发布了新一代AI大模型系列——Claude3。该系列包含三个模型,按能力由弱到强排列分别是Claude3Haiku、Claude3Sonnet和Claude3Opus。其中,能力最强的Opus在多项基准测试中得分都超过了GPT-4和Gemini1.0Ultra,在数学、编程、多语言理解、视觉等多个维度树立了新的行业基准。Anthropic表示,Claude3Opus拥有人类本科生水平的知识。在新模型发布后,Claude首次
-
微调在构建有价值的人工智能工具中起着至关重要的作用。这种使用更有针对性的数据集精炼预训练模型的过程可使用户大大增加模型对专业内涵的理解,允许用户为特定任务的模型增加现成知识。虽然这个过程可能需要时间,但与从头开始训练模型相比,它的成本效益通常要高三倍。这一数值正如OpenAI最近宣布扩展其自定义模型程序以及为其微调API提供各种新功能所反映的那样。自服务微调API的新特性OpenAI于2023年8月首次宣布推出针对GPT-3的自助微调API,并受到了AI社区的热烈响应。据OpenAI报告称,成千上万的团体
-
写在前面&笔者的个人理解该算法允许在线高精度地图构建。我们的方法MapTracker将传感器流累积到两种显示的内存缓冲区中:1)鸟瞰图(BEV)空间中的Rasterlatents和2)道路元素(即人行横道、车道线和道路边界)上的Vectorlatents。该方法借鉴了目标跟踪中的查询传播范式,该范式明确地将前一帧的跟踪道路元素与当前帧相关联,同时融合了与距离步幅的内存latents子集,以进开源链接:https://map-tracker.github.io/总结来说,本文的主要贡献如下:一种新的
-
一个月前,Meta+发布了开源大模型llama3系列,在多个关键基准测试中优于业界SOTA模型,并在代码生成任务上全面领先。此后,开发者们便开始了本地部署和实现,比如llama3的中文实现、llama3的纯NumPy实现等。十几个小时前,有位名为"NishantAklecha"的开发者发布了一个从零开始实现llama3的存储库,包括跨多个头的注意力矩阵乘法、位置编码和每个层在内都有非常详细的解释。该项目得到了大神Karpathy的称赞,他表示项目看起来不错,完全展开后,通过模块嵌套和相互调用,可以更容易地
-
AGI时代,大模型技术为行业带来颠覆式变革。大模型技术的快速迭代离不开海量数据的支撑,高质量专业数据的流动与共享,是促进大模型技术应用加速发展的一个重要环节。然而,大模型在创造巨大价值的同时,也为数据的大规模应用带来安全和隐私挑战。高质量行业数据的提供者担心大模型“记住”明文训练数据而导致数据价值丧失,因此不愿提供行业数据;用户访问大模型时的信息也有可能被模型方违规收集和使用,导致个人隐私和商业机密被泄露的风险。隐私计算对于解决这个过程中存在的数据安全与隐私问题极具意义和价值。由世界人工智能大会组委会办公
-
事实证明,扩散模型不仅能用于生成图像和视频,也能用于合成新程序。假设我们给模型一张手绘的「5」状图形,它就能通过不断突变来修改程序,最终得到能输出目标图形的程序。该模型来自加州大学伯克利分校的一个研究团队,他们提出的这种程序合成新方法使用了神经扩散模型来直接操作句法树。论文一作为该校博士生ShreyasKapur,其导师为该校计算机科学教授StuartRussell。论文标题:DiffusionOnSyntaxTreesForProgramSynthesis论文地址:https://arxiv.org/p
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com吴翼,清华大学交叉信息院助理教授,曾任OpenAI全职研究员,研究领域为强化学习,大模型对齐,人机交互,机器人学习等。2019年在美国加州大学伯克利分校获得博士学位,师从StuartRu
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文作者来自香港科技大学、香港大学和华为诺亚方舟实验室等机构。其中第一作者陈铠、苟耘豪、刘智立为香港科技大学在读博士生,黄润辉为香港大学在读博士生,谭达新为诺亚方舟实验室研究员。随着Op
-
编辑|KX此前,GoogleDeepMind研究人员开发的费米子神经网络(FermiNet)非常适合对大量电子的量子基态进行建模。FermiNet最初专注于分子的基态。但是,当分子和材料受到大量能量的刺激时,例如暴露在光或高温下,电子可能会被踢入更高的能量状态——激发态。激发态在物理学和化学等领域都很重要;然而,从第一原理出发对激发态特性进行可扩展、准确且稳健的计算仍然面临重要的理论挑战。现在,DeepMind研究人员开发了一种计算激发态的新方法,它比以前的方法更强大、更通用。该方法可以应用于任何类型的数
-
盛科通信发布公告,预计2025年与中国电子信息产业集团有限公司及其下属公司(该集团持有公司5%以上股份)的关联交易总额将达5.02亿元。其中,预计向关联方销售商品5亿元,占同类业务的48.20%;预计向关联方采购原材料200万元,占同类业务的0.19%。公告显示,2024年,公司实际向关联方销售商品3.57亿元(预计6.55亿元),采购原材料33万元(预计300万元)。盛科通信强调,所有关联交易将遵循公平、公正、公允的原则,确保不会损害公司及股东利益,也不会影响公司独立性,并认为这些交易对公司持续经营和发
-
12月9日,北京博科测试系统股份有限公司(简称“博科测试”)正式开启创业板IPO申购,申购代码为301598,申购价格38.46元。博科测试是一家通过采用现代测试与试验技术来提供智能测试综合解决方案的供应商,主营业务为伺服液压测试设备和汽车测试试验设备的研发、设计、制造、销售、系统集成等综合服务,其主要可分为两大类:(1)公司主要为高等院校、科研院所、整车制造厂商、车辆研究所设计伺服液压测试系统解决方案,并提供方案所需的伺服液压测试设备及相关技术服务,以满足客户对不同工况下振动模拟试验或结构加载试验的测试
-
本周A股市场三大指数整体上扬,沪指上涨0.68%,收于3,391.88点;深证成指上涨0.74%,收于10,713.07点;创业板指上涨0.62%,收于2,235.26点。然而,科创50指数表现相对疲软,下跌1.20%,收于989.78点。半导体板块表现亮眼,指数上涨2.31%。集微网对198家半导体公司进行统计分析,发现IC概念股本周涨跌互现,上涨公司数量略多于下跌公司,具体为102家上涨,96家下跌。根据同花顺iFinD数据,本周涨幅居前的五家公司分别为:乐鑫科技(53.77%)、龙迅股份(38.72