-
由英国政府AI安全研究所联合多所顶尖高校的计算机科学家开展的一项研究揭示,当前广泛用于衡量新一代人工智能(AI)模型安全性与效能的评估体系存在普遍性漏洞。研究人员对超过440个现有基准测试进行了系统分析,结果发现几乎每一项测试都在设计或执行层面存在某种形式的缺陷,可能严重影响其评估结果的可信度。牛津互联网研究所的研究员安德鲁・比恩(AndrewBean)作为该研究的主要负责人指出,这些基准测试本应是验证新型AI系统是否安全、可控并符合人类价值观的关键手段。然而,由于行业缺乏统一的技术标准和严谨的验证机制
-
美国总统川普于24日签署一项行政命令,正式推出名为「创世纪任务」(GenesisMission)的国家级人工智慧(AI)加速计划,旨在提升美国在全球AI领域的竞争力,并巩固其在科学研究上的领导地位。根据白宫公布的命令内容,能源部将负责建立一个整合型AI平台,整合全国的国家超级电脑、联邦科学数据库以及各类研究设施资源,以推动核融合、半导体制造等前沿科技的快速发展。该平台将在未来九个月内,针对能源部于六十天内所提出的二十项关键科学挑战,实现至少一项初步运行成果。延伸阅读:ClaudeOpus4.5登场!
-
11月25日消息,据Investing.com援引外媒《TheInformation》报道,目前在AI基础设施上严重依赖英伟达GPU的Meta,正与谷歌商谈在其自有数据中心内部署谷歌TPU芯片的相关事宜。报道称,Meta在引入谷歌TPU的策略上将结合云服务与实体硬件两种模式:计划最早从明年起通过GoogleCloud租用TPU算力,并考虑自2027年起采购价值数十亿美元的TPU芯片用于自身数据中心。若该合作最终达成,将成为谷歌对外销售TPU的一项重大突
-
11月25日,据“网信中国”微信公众号消息,网信部门依法对一批在人工智能生成合成内容标识方面存在违法违规行为的移动互联网应用程序进行了集中查处。针对部分网站平台未能有效执行人工智能生成合成内容标识的相关规定,近期网信部门已对相关违规App采取了包括约谈、责令限期整改、下架下线等在内的多项处置措施。主要违规情况包括:1、人工智能生成合成服务提供者未对所生成的内容添加可被用户明显识别的显式标识;在提供内容导出功能时,也未在导出文件中加入显式标识;同时,在生成内容的文件元数据中缺少包含属性信息、服务方名称或编码
-
快手旗下StreamLake平台近日发布公告,自KAT-Coder模型系列上线后,获得了广大用户踊跃试用与高度认可。为回馈社区支持,平台将开启KAT-Coder-ProV1模型限时免费体验活动。本次活动自公告发布之时起生效,持续至11月11日00:00:00(北京时间)结束。KAT-Coder是由快手Kwaipilot团队自主研发的闭源大模型,定位为代码生成领域的旗舰产品。官方数据显示,该模型在SWE-BenchVerified基准测试中实现了高达73.4%的任务解决率,展
-
月之暗面正式推出Kimi迄今最强开源思考模型——KimiK2Thinking,该模型基于“模型即Agent”理念打造,原生具备“边思考、边使用工具”的能力。在Humanity'sLastExam、BrowseComp、SEAL-0等多项权威基准测试中达到SOTA水平,并在Agentic搜索、编程、写作与综合推理方面实现全面升级。KimiK2Thinking无需人工干预,可自主完成高达300轮的工具调用与持续多轮思考,有效应对复杂任务。“这是我们在Test-TimeScaling(测试时扩展)
-
11月19日,工业和信息化部召开新闻发布会,通报了GB6675《玩具安全》系列强制性国家标准的修订进展。工业和信息化部消费品工业司司长何亚琼在发布会上提到,AI玩具正受到广泛欢迎,已成为行业发展的新焦点。数据显示,2024年我国AI玩具市场总规模约为246亿元,预计到2025年将攀升至290亿元。何亚琼强调,在技术革新与消费升级的共同推动下,我国玩具产业正在步入智能化的新阶段。人工智能技术与传统玩具深度融合,持续改变产品形态与产业链格局,AI玩具已逐步成为引领产业转型升级的
-
让编程语言与大模型深度融合,MoonBitPilot项目期待您的加入!随着AI大语言模型(LLM)技术的持续突破,编程正迎来一次从“辅助开发”走向“智能交付”的深刻变革。从ChatGPT、Claude到LLaMA,AI正以前所未有的速度重塑开发方式。在这一浪潮中,MoonBit团队正全力打造新一代AI原生开发平台——MoonBitPilot。它基于自研编程语言MoonBit,深度融合大模型语义理解与编译器智能,目标是让开发者能用自然语言描述意图,系统即可生成、修复与重构完整软
-
从「电子代工王国」到晶片追赶者自2001年加入WTO以来,中国迅速成长为全球电子产品制造中心,并在2010年代初实现贸易顺差。然而,长期面临芯片消费远高于自给的困境——2019年数据显示,中国半导体市场需求占全球约三成,但本土产能仅能满足一成左右。随着美中贸易战爆发,美国对华为等企业实施先进制程芯片与关键设备的出口限制,促使中国加速构建自主的半导体产业链,涵盖封装测试、晶圆代工及材料供应体系。至2023年,中国已占据全球半导体制造设备需求的30%以上,成为推动全球设备市场增长的核心动力。产能领先、营收滞后
-
Manus正式发布全新功能——ManusBrowserOperator。这是一款专为Chrome和Edge浏览器设计的扩展插件,只需一键安装,即可将你日常使用的浏览器瞬间变身为具备完整AI代理能力的智能浏览器。无需额外配置环境、无需重新登录账户、也无需下载独立应用,ManusAI能直接在你的本地浏览器中执行操作,彻底解决传统云端自动化工具常遇到的验证码拦截、会话失效、IP封禁等难题。该功能目前已面向Pro、Plus以及Team等付费用户开放Beta测试,免费用户暂无法使用。
-
感谢网友刺客的线索投递!11月21日消息,美国半导体行业协会(SIA)于今日发布官方声明,正式宣布AMD董事长兼首席执行官苏姿丰博士当选为该协会新任董事会主席。图源:SIA官方公告注:美国半导体行业协会(SIA)成立于1977年,是代表美国半导体产业的权威性贸易组织与政策倡导机构,致力于维护行业利益,并推动美国在全球半导体领域的领导地位。作为美国半导体行业的核心代表,SIA汇聚了全美几乎全部的半导体企业,其成员贡献了全美行业总收入的99%,同时吸引了近三分之二的非美国籍主要芯片企
-
摺叠手机市场即将迎来关键变局。根据最新供应链消息指出,Apple似乎已成功克服摺叠萤幕最大的技术挑战——中央摺痕问题,为预计在2026年推出的iPhoneFold大规模量产铺平道路。告别摺痕:打造市场首款「真正无痕」摺叠机据供应链消息人士透露,Apple在解决萤幕摺痕方面取得了重大突破。现有的摺叠智慧型手机在频繁弯折处容易出现明显摺痕,不仅影响使用者体验,更可能导致萤幕寿命缩短或破裂。若消息属实,这项独家解决方案将使iPhoneFold成为市场上首款具备「真正无痕」设计的摺叠装置。过去
-
感谢网友Roronoa_提供的线索!11月17日消息,据央视军事报道,第十九届迪拜航展于今日正式拉开帷幕,中国航空力量闪耀登场。在2025迪拜航展的室外静态展区,一架翼龙-X无人机的1:1模型引人注目,这也是该机型首次在海外航展中进行静态展示。此前有消息称,中国航发将携多款主力产品首次亮相迪拜航展。此次参展是中国国产航空发动机在境外展出历史上谱系最完整、内容最全面、展品数量最多的一次,共设置五个展区,集中展示了19种动力装置。针对中东及非洲市场的实际需求,中国航发展出了涵盖军用动力
-
AI搜索初创公司Perplexity近日宣布,其基于人工智能的浏览器Comet现已正式上线Android平台。今年7月,Comet首次在桌面端发布,主打以AI为核心的信息获取体验。此次推出的Android版本延续了桌面版的核心功能。用户可将Perplexity设为默认搜索引擎,并通过标签提及方式直接向AI助手提问;同时支持语音输入模式,能够针对当前所有打开的标签页发起查询,助手还能自动汇总各页面的搜索内容,提供简洁摘要。据官方介绍,Comet浏览器不仅能辅助用户高效检索信息、完成网购操作,还允许用户实时查
-
在AgentScope1.0版本发布仅两个月后,阿里通义实验室再次发力,为其开源的智能体开发框架带来重磅更新。作为专注于多智能体系统研发的生产级工具,AgentScope正持续加速智能体应用的落地进程。全新智能体应用开源亮相本次更新中,项目正式开源两款基于AgentScope构建的实用型智能体:Alias-Agent:具备强大的任务规划与执行能力,能够根据场景需求在ReAct、Planner-Executor、DeepResearch和Browser-Use四种专业模式间动态切换。该