-
在机器学习领域,不平衡数据集是一种常见问题,指的是训练数据集中不同类别的样本数量差异很大。例如,在二分类问题中,正样本数量远远小于负样本数量。这会导致训练出的模型更倾向于预测数量更多的类别,而忽略数量较少的类别,从而影响模型的性能。因此,需要对不平衡数据集进行分类处理,以提高模型的性能。本文将通过一个具体的示例来说明如何对不平衡数据集进行分类处理。假设我们有一个二分类问题,其中正样本数量为100,负样本数量为1000,特征向量的维度为10。为了处理不平衡数据集,可以采取以下步骤:1.使用欠采样或过采样技术
-
写在前面&笔者的个人总结近年来,自动驾驶领域的3D占据预测任务因其独特的优势受到学术界和工业界的广泛关注。该任务通过重建周围环境的3D结构,为自动驾驶的规划和导航提供详细信息。然而,目前主流的方法大多依赖于基于激光雷达(LiDAR)点云生成的标签来监督网络训练。在最近的OccNeRF研究中,作者提出了一种自监督的多相机占据预测方法,名为参数化占据场(ParameterizedOccupancyFields)。该方法解决了室外场景中无边界的问题,并重新组织了采样策略。然后,通过体渲染(VolumeR
-
扩散模型,迎来了一项重大新应用——像Sora生成视频一样,给神经网络生成参数,直接打入了AI的底层!这就是新加坡国立大学尤洋教授团队联合UCB、MetaAI实验室等机构最新开源的研究成果。具体来说,研究团队提出了一种用于生成神经网络参数的扩散模型p(arameter)-diff。用它来生成网络参数,速度比直接训练最多提高44倍,而且表现毫不逊色。该模型一经发布后,在AI社区迅速引起了激烈的讨论,圈内专家对其表现出了与普通人看到Sora时一样的惊叹态度。甚至有人直接惊呼,这基本上相当于AI在创造新的AI了。
-
在标准的UNet结构中,longskipconnection上的scaling系数一般为1。然而,在一些著名的扩散模型工作中,比如Imagen,Score-basedgenerativemodel,以及SR3等等,它们都设置了,并发现这样的设置可以有效加速扩散模型的训练。质疑Scaling然而,Imagen等模型对skipconnection的Scaling操作在原论文中并没有具体的分析,只是说这样设置有助于加速扩散模型的训练。首先,这种经验上的展示,让我们并搞不清楚到底这种设置发挥了什么作用?另外,我们
-
用于患者管理的数字孪生:通过整合个人的虚拟副本,数字孪生可用于预防性医疗保健。这被称为人类数字孪生,融合了遗传、生活方式和环境因素等因素。其范围从代表整个人体到特定的器官。这些数据是从可穿戴传感器、生活方式信息和临床机构收集的。人类数字孪生还允许创建大量患者的数字复制品,从而能够测试不同的药物,以确定对每位患者最有效的治疗方法。项目如“SIMULIA活体心脏”利用数字孪生技术,通过计算机模拟来研究人体和药物之间的相互作用。这种技术使医生能够深入了解心脏复杂的结构,检测与缺血性心脏病(IHD)等疾病相关的事
-
扩散模型在图像生成方面的色彩表现中发挥了作用,推动了生成式模型的新纪元。如StableDiffusion、DALLE、Imagen、SORA等大模型如雨后春笋般涌现,进一步丰富了生成式AI的应用背景。然而,当前的扩散模型在理论上并非完美,鲜有研究关注到采样样本时段端点处未定义的奇点问题。此外,奇点问题在应用中导致的平均灰度等影响生成图像质量的问题也一直未得到解决。为了解决这一难题,微信视觉团队与中山大学合作,联手探究了扩散模型中的奇点问题,并提出了一个即插即用的方法,有效解决了初始时刻的采样问题。该方法成
-
5月30日,腾讯宣布旗下混元大模型全面升级,基于混元大模型的App“腾讯元宝”正式上线,苹果及安卓应用商店均可下载。相比此前测试阶段的混元小程序版本,面向工作效率场景,腾讯元宝提供了AI搜索、AI总结、AI写作等核心能力;面向日常生活场景,元宝的玩法也更加丰富,提供了多个特色AI应用,并新增了创建个人智能体等玩法。“腾讯做大模型不争一时之先。”腾讯云副总裁、腾讯混元大模型负责人刘煜宏表示:“过去的一年,我们持续推进腾讯混元大模型的能力爬坡,在丰富、海量的业务场景中打磨技术,同时洞察用户的真实需求,希望腾讯
-
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文主要作者来自波形智能、浙江大学、和北京航空航天大学。共同一作中,周王春澍是波形智能的联合创始人和CTO,欧翌昕是浙江大学硕士二年级,丁盛为为北京航空航天大学四年级本科生。文章的通讯作
-
1.10月16日,鹏辉能源宣布,为优化产能分配并提升市场影响力,将在驻马店市正阳县投资10亿元,新建日产3万支小动力方形铝壳锂离子电池和日产50万支电容式锂离子电池项目。2.鹏辉能源将在正阳县成立全资或控股子公司作为项目执行主体。项目资金将通过股债结合的方式筹集,包括银行贷款、发行可转债、优先股、配股和非公开发行股份等。具体融资方式和计划尚未确定,尚未签署相关协议。3.鹏辉能源表示,此投资符合其发展战略,旨在优化产能布局、增强市场影响力和竞争力,满足未来业务拓展需求。该项目将对公司产业布局和发展产生积极且
-
子曾经曰过:「见贤思齐焉,见不贤而内自省也。」自省可以帮助我们更好地认识自身和反思世界,对AI来说也同样如此吗?近日,一个多机构联合团队证实了这一点。他们的研究表明,语言模型可以通过内省来了解自身。论文标题:LookingInward:LanguageModelsCanLearnAboutThemselvesbyIntrospection论文地址:https://arxiv.org/pdf/2410.13787让LLM学会自省(introspection)其实是一件利害皆有的事情。好的方面讲,自省式模型可
-
11月14日,芳源股份在接受机构调研时表示,公司目前产品主要分为前驱体、中间品镍钴盐、碳酸锂三大块。公司此前做前驱体8系、9系等高镍、超高镍产品为主,今年起公司积极开拓客户,加大了5系、6系等产品的销售以扩大销量。碳酸锂是公司近两年的发展主力,目前产能已在逐步起量,公司会持续通过技改增加碳酸锂的产能,同时持续推进中间品镍钴盐的销售,以减少三元前驱体市场变化带来的不利影响。芳源股份提到,自从广期所推出了碳酸锂期货之后,产品有了定价依据和新的销售渠道,对碳酸锂企业具有积极作用。目前公司销售碳酸锂主要按照期货和
-
凌云光斥资7.85亿元收购JAI,剑指机器视觉领域全球领导地位!近日,凌云光发布公告,计划通过定向增发A股,募集不超过7.85亿元资金,用于收购机器视觉巨头JAI100%股权。此举旨在提升公司竞争力,完善产品线,并增强核心器件的国产化替代能力。凌云光专注于“视觉+AI”技术,在光学成像、算法软件和自动化底层技术方面拥有深厚积累,为消费电子、新能源等行业提供产品和解决方案。而JAI作为机器视觉行业的老牌企业,拥有50多年历史,其高性能面阵扫描相机、线阵扫描相机和分光棱镜式相机享誉全球。此次收购,凌云光看重J
-
12月11日,盛路通信发布公告称,公司于今日审议通过了《关于部分募集资金投资项目延期的议案》,同意公司根据目前募集资金投资项目的实际实施情况,在募集资金投资项目其他内容不发生变更的情形下,对募集资金投资项目“南京恒电微波信号模拟技术中心及环境试验与测试中心建设项目”和“盛恒达科创产业园一期”的达到预定可使用状态日期进行调整,由原计划的2024年12月31日延期至2025年12月31日。公告显示,目前,“盛恒达科创产业园一期项目”已经基本完成了主体结构建设,盛路通信基于业务发展及未来规划需要,在施工过程中优
-
欧洲电动汽车电池产业迎来利好消息!汽车制造巨头Stellantis与全球电池领导者宁德时代携手,将在西班牙萨拉戈萨投资高达41亿欧元(约43亿美元),建设一座大型电动汽车电池工厂。该工厂预计于2026年底投产,采用磷酸铁锂电池技术,最高产能可达50吉瓦时,这将显著提升欧洲电动汽车电池的供应能力。Stellantis致力于在电动汽车领域保持竞争优势,积极采用先进电池技术。董事长JohnElkann表示,此举是公司在电动化战略中的重要一步。此合作项目对欧洲电池产业发展意义重大。此前,欧洲本土电池产业发展面临挑
-
近日,工业和信息化部根据《关于印发〈国家高新技术产业开发区综合评价指标体系〉的通知》,完成了2024年178家国家高新区综合评价工作,并公布了综合评价前50名以及工业总产值、高技术产业营业收入、企业研发经费投入强度、人均技术合同成交额、优质企业数量、营商环境等六个单项评价前20名排名情况。从综合评价来看,中关村科技园区、深圳高新技术产业园区、上海张江高新技术产业开发区、苏州工业园区、西安高新技术产业开发区位列2024年国家高新区综合评价名单前五;从工业总产值来看,深圳高新技术产业园区、上海张江高新技术产业