-
2023年8月22日,在上海举行了“骑到AI背上去”钉钉生态大会。在数字员工专场分论坛上,钉钉副总裁兼音视频事业部负责人赵加雨发表了主题演讲,分享了钉钉音视频在智能化方面的进展和应用,以及基于钉钉AIPaaS的视频会议领域未来的开放展望赵加雨提到,钉钉在4月份宣布要全面接入大模型,以完成智能化再造。随着人工智能与音视频的结合越来越深入,钉钉会议也实现了许多创新应用。除了之前的实时翻译、字幕转写和智能摘要,这次还推出了三项新功能:数字分身代替参会、自然语言控制会议操作和文生虚拟背景。其中,数字分身可以在会议
-
百度旗下的AI大模型产品文心一言在8月31日凌晨宣布,已经率先通过《生成式人工智能服务管理暂行办法》的备案,成为首批通过备案的8家公司之一。这意味着文心一言可以正式上线,向公众提供服务百度旗下的AI大模型产品文心一言App目前已经在应用商店上架百度浏览器今天中午推出了文心一言(网页版)和AI搜索功能(测试版),用户需要登录百度账号才能使用在PC端,用户可以直接点击百度首页搜索栏上方的大字图标来登入文心一言,而AI搜索入口则位于搜索栏的最上角当点击搜索后,入口位置将移动到搜索栏正下方的最左边为了将内容进行改
-
IT之家9月7日消息,“西门子医疗”官方公众号今日发文宣布,全国首例可视化皮瓣移植术在中山大学孙逸仙纪念医院成功实施,此举标志着“手术台上的元宇宙”正式成为现实。报道称,该院一位58岁的左侧舌癌患者需要动手术,但由于其股前外侧皮瓣的血管存在一定的变异性,仅依靠传统的手术规划,并不能精准地在术中找到可靠的穿支动脉,以确保皮瓣切取百分百成功。该院口腔颌面外科主任范松团队运用了“元宇宙”医教研解决方案,来完成此次手术。据介绍,此次手术通过将全息仿生实景渲染图实时配准患者实体,在人体表面精准勾画相关区域的血管走行
-
可扩展地图:用于在线长距离向量化高清地图构建的可扩展地图学习请点击以下链接阅读论文:https://arxiv.org/pdf/2310.13378.pdf代码链接:https://github.com/jingy1yu/ScalableMap作者单位为武汉大学论文思路:本文提出了一种新颖的端到端流程,用于使用车载摄像头传感器构建在线远距离矢量化高精度(HD)地图。高精度地图的矢量化表示使用折线和多边形来表示地图要素,这些要素被下游任务广泛使用。然而,之前参考动态目标检测设计的方案忽略了线性地图要素内部的
-
华为最近向Mate60Pro、Mate60Pro+等机型推送了鸿蒙OS4.0.0.126更新126更新不仅优化部分场景通信体验、整机系统稳定性,还带来了一项新功能——AI云增强,可提升人像清晰度和美感度,堪称在线“P图”神器。新功能加入后,许多用户对于如何开启和使用该功能感到困惑,但请不要着急,接下来我会为你解答目前,AI云增强支持Mate60Pro、Mate60Pro+、Mate60RS非凡大师和MateX5,系统版本必须是鸿蒙OS4.0.0.126。升级后,大家就能在图库的设置中找到“AI云增强功能”
-
11月7日,通用足式机器人公司逐际动力LimXDynamics迎来两位核心成员加入,张力任逐际动力联合创始人兼COO,香港大学长聘副教授潘佳博士为逐际动力首席科学家。二位的加入充分体现了逐际动力作为一家以技术驱动的初创公司,从创立之初,对技术和产品商业化的高度重视,始终积极推动以具身智能为代表的前沿AI技术在通用足式机器人上的发展和应用。逐际动力欢迎张力和潘佳博士加盟,分别担任联合创始人兼COO和首席科学家张力曾任无人驾驶独角兽COO和世界500强高管,作为逐际动力的COO,张力将负责公司海内外业务的战略
-
任天堂新专利表明:Switch2有可能支持会VR设备根据公开发布的文件,任天堂正在申请专利来设计虚拟现实设备该专利是一种护目镜装置形式的“图像显示系统”。乍一看专利图,该设备的外观与任天堂LaboVR系统相似。该专利的美国公布日期为2023年11月16日,但这一系列文件的首次申请日期为7月26日。奇怪的是,该专利的相关文件的首次提交日期提交日期为2019年3月20日,日本列为原产国。而通过对专利分类及其子类别的进一步分析,发现任天堂VR设备被描述为具有以下特点:需要重新写作的内容是:头戴式平视显示器参数变
-
IT之家的消息显示,青海昆仑人工智能算力中心于本周四在西宁锦诚大厦正式揭牌并启动运营,这也是青藏高原第一座智算中心根据青海昆仑人工智能算力中心依托三江源国家大数据基地的报道,综合青海日报等当地媒体的消息,该中心旨在托管和运营算力资源,推动人工智能算力产业的建设和深度落地。其目的是推动青海省数字产业化和产业数字化进程,为青海打造一个全国级的算力产业生态标杆该中心的投用,将为西宁市公共平台提供强大的底层数据分析和处理能力,打通水、电、燃气等各类城市基础设施数据,并在市域社会治理、城市安全、民生服务等领域落地基
-
最近谷歌发布了号称规模最大、功能最强大的人工智能模型Gemini,放出了演示视频,声称性能超越GPT-4和人类专家。星空君最近长期进行文生图、文生视频等开源工具的研究,对业界的进展比较了解,虽然理论上做到这种程度并不难,但似乎来得太快。打脸的是,很快谷歌承认放出的Gemini视频是经过剪辑的。随着印度人主导美国的高科技企业,类似情况会越来越多,这是民族文化决定的必然结果。华人为什么在欧美企业很难成为领导者(像黄仁勋这样的个例很少见)?原因很简单,最能吹牛的中国人都留在国内写研报了。例如,Gemini发布后
-
谷歌DeepMind号称打造出了首个能在广泛3D虚拟环境和视频游戏中遵循自然语言指令的通用AI智能体。名为SIMA,不是NPC,是可以成为玩家拍档,帮忙干活打杂的那种。比如,在《模拟山羊3》(GoatSimulator3)中当司机开开车:在《幸福工厂》(Satisfactory)中挖矿石:在《瓦尔海姆》(Valheim)中寻找水源:在《无人深空》中(NoMan’sSky)驾驶宇宙飞船射击小行星收集资源:……SIMA全称ScalableInstructableMultiworldAgent,顾名思义可扩展、
-
本站4月2日消息,虽然目前Siri可以尝试描述信息中的图片,但效果并不稳定。不过,苹果公司并没有放弃人工智能领域的探索。在最近的一篇研究论文中,苹果的人工智能团队描述了一种可显著提升Siri智能的模型,而他们认为这个模型名为ReALM的模型在测试中优于OpenAI的知名语言模型GPT-4.0。这篇文章介绍了ReALM的特别之处,它可以同时理解用户屏幕上的内容和正在进行的操作。讨论分为以下三种类型:屏幕实体:指的是当前显示在用户屏幕上的内容。对话实体:指的是与对话相关的内容。例如,用户说“打电话给妈妈”,那
-
神经网络作为深度学习技术的基础已经在诸多应用领域取得了有效成果。在实践中,网络架构可以显著影响学习效率,一个好的神经网络架构能够融入问题的先验知识,确立网络训练,提高计算效率。目前,经典的网络架构设计方法包括人工设计、神经网络架构搜索(NAS)[1]、以及基于优化的网络设计方法[2]。人工设计的网络架构如ResNet等;神经网络架构搜索则通过搜索或强化学习的方式在搜索空间中寻找最佳网络结构;基于优化的设计方法中的一种主流范式是算法展开(algorithmunrolling),该方法通常在有显式目标函数的情
-
六位一线AI工程师和创业者,把在大模型应用开发上摸爬滚打一整年的心得,全!分!享!了!(奇怪的六一儿童节大礼包出现了)这篇干货长文,一时间成为开发者社区热议的话题。有网友评价为,大模型领域少有的“有操作性”的实用见解,非常值得一读。这6位作者来自不同背景,比如有大厂工程师,也有独立开发者,还有咨询顾问。但他们的共同之处,是过去一年里一直在大模型之上构建实用程序,而不只是炫酷的Demo演示,他们认为:现在正是非机器学习工程师或科学家,也能把AI构建到产品中的时候。在他们的一系列分享中,网友热议的亮点包括但不
-
北京智源大会是人工智能领域综合性内行盛会,自2019年10月首度亮相,已成功举办五届。大会以鲜明的特色,邀请海内外研究者开展精彩演讲与深入对话,共11位图灵奖得主曾参与大会,每年约200位顶尖专家出席,来自30多个国家和地区的50万观众汇聚一堂,分享研究成果、探寻前沿知识、交流实践经验、建立紧密合作。大会特色全球视野:与世界顶尖专家面对面交流,体验技术无国界的魅力思想碰撞:年度杰出研究者齐聚一堂,交流新思想,探讨新思路前沿引领:探讨AI领域关键问题,发布重要概念,指引未来方向过往五年的璀璨篇章,点亮AI领
-
在刚刚结束的全球开发者大会上,苹果宣布了Appleintelligence,这是一款深度集成于iOS18、iPadOS18和macOSSequoia的全新个性化智能系统。苹果+智能由多种高度智能的生成模型组成,这些模型专为用户的日常任务设计。在苹果刚刚更新的博客中,他们详细介绍了其中两款模型。一个拥有约30亿参数的设备端语言模型;一个更大的基于服务器的语言模型,该模型通过私有云计算在苹果服务器上运行。这两个基础模型是苹果生成模型家族的一部分,苹果表示,他们会在不久的将来分享更多关于这一模型家族的信息。在这