-
2024年2月27日,由毫末智行人工智能技术团队提交的论文《Cam4DOcc:BenchmarkforCamera-Only4DOccupancyForecastinginAutonomousDrivingApplications》成功入选国际顶会CVPR2024。Cam4DOcc是毫末提出的一种新的基准,它利用摄像头进行4D占据网格预测。这种方法可以评估近期内周围场景的变化,将摄像头的占据网格估计扩展到时空预测。这样一来,自动驾驶系统在感知和预测周围环境动态变化方面的能力得到了提升。首先,毫末基于几个公
-
在普渡大学数字孪生实验室的最新研究中,科学家们采用了一项革命性技术——利用大型语言模型(LLM)来增强自动驾驶汽车的智能指令解析能力。这一创新为自动驾驶技术的发展带来了新的可能性,有望提高车辆对驾驶指令的理解和响应速度。这项技术的关键是Talk2Drive框架,旨在利用人类自然语言来操控自动驾驶汽车,开创了一种独特的人车交互方式。图片论文链接:https://arxiv.org/abs/2312.09397项目网站:purduedigitaltwin.github.io/llm4ad通过其创新的设计,Ta
-
4月4日消息,据英国《金融时报》援引三位熟悉谷歌的知情人士消息称,谷歌考虑对基于人工智能的搜索收费,这对其商业模式来说是一次重大变化。因为自2000年以来,谷歌的搜索产品一直都是依靠广告盈利的。据报道,谷歌正在考虑保持标准搜索(不含AI功能)免费,谷歌正在考虑各种选择,包括将某些基于AI的搜索功能添加到其高级订阅服务中。但是,付费用户仍将在Gemini驱动的搜索结果中看到广告。尽管搜索广告去年为谷歌带来了1750亿美元的收入,但仍可能不足以弥补AI搜索增加的成本。根据路透社去年的报告,通过Gemini等高
-
撰稿丨诺亚如何让一个AI回答一个它本不应该作答的问题?有很多这种所谓的“越狱”技术,而Anthropic的研究人员最近发现了一种新方法:如果首先用几十个危害性较小的问题对大型语言模型(LLM)进行预热,就能诱使其告诉你如何制造爆弹。这种方法的关键在于对模型进行逐渐引导,从简单的问题开始,逐渐升级到更复杂的问题。通过这种方式,模型在逐步学习和适应的过程中,可以产生一系列有关制造爆炸的提示和指导。虽然这种技术有一定的潜在危他们称这种方法为“多轮越狱”,不仅涉及相关论文,还将其告知了人工智能领域的同行们,以便能
-
以下10款类人机器人正在塑造我们的未来:1、ASIMO:ASIMO由Honda开发,是最知名的人形机器人之一。ASIMO高4英尺,重119磅,配备先进的传感器和人工智能功能,使其能够在复杂的环境中导航并与人类互动。ASIMO的多功能性使其适用于各种任务,从帮助残疾人到在活动中进行演示。2、Pepper:由SoftbankRobotics创建,Pepper旨在成为人类的社交伴侣。凭借其富有表现力的面孔和识别情绪的能力,Pepper可以参与对话、在零售环境中提供帮助,甚至提供教育支持。Pepper的人形设计和
-
物联网(IoT)彻底改变了我们与技术交互的方式,连接设备和系统以提高效率和便利性。然而,这种互联的网络也带来了重大的安全挑战。为了加强物联网安全,利用人工智能(AI)和机器学习(ML)技术已成为一种有前景的解决方案。通过利用人工智能和机器学习的力量,组织可以主动检测威胁、降低风险,并增强物联网生态系统的整体安全态势。物联网安全挑战不同的攻击面:物联网环境的庞大连接设备网络为网络攻击者提供了多个潜在的入口点。从智能家居设备到工业传感器,每一项都可能存在潜在漏洞,需要进行监控以防止未经授权的访问。对物联网设备
-
“我讲课不割韭菜,宗旨是免费、分享、科普、交流。AI时代技术发展迅速,AI知识普及尤为重要。”2月29日,360公司创始人周鸿祎免费课正式开启,全网多平台直播了AI系列第一讲“预见AGI”,千万网友观看。免费课上,周鸿祎系统分享了对AI新发展趋势的洞察、企业拥抱AI的建议,并现场演示了大模型重塑的两款国民级互联网产品360AI搜索和360AI浏览器,由于用户体验火爆,瞬时流量暴增44倍,为满足全网用户需求临时增加了服务器。周鸿祎称,AI的指数级跃进给人“度日如年”之感,自己去年年底预测的2024年AI十大
-
许多制造商正在将复杂的分析和人工智能应用于其物联网数据,以实时监控运营、提高效率并做出明智的决策。为什么物联网值得如此关注?是因为物联网在消费者、商业和工业市场中的应用正在蓬勃发展。许多研究估计了当前部署的物联网设备数量。2024年,联网的物联网设备数量约为170亿台。预计到2030年,这一数字将至少翻两倍。这些数字包括所有联网的物联网设备,例如工业和消费产品中的设备。目前有近十几个垂直行业拥有超过1亿台联网物联网设备。这些行业包括电力、天然气、供水、零售、政府等。过去的一项市场研究发现,在这些工业领域中
-
在计算机科学领域,图形结构由节点(代表实体)和边(表示实体之间的关系)构成。图无处不在。互联网可以被视为一个庞大的网络,搜索引擎利用图形化的方式来组织和展示信息。LLMs主要在常规文本上训练,因此将图转化为LLMs可理解的文本是一项具有挑战性的任务,因为图结构与文本有着根本的不同。在ICLR2024上,一支来自谷歌的团队探索了如何将图形数据转换为适合LLMs理解的形式。论文地址:https://openreview.net/pdf?id=IuXR1CCrSi使用两种不同的方法将图形编码为文本,并将文本和问
-
撰稿|伊风在整个2月份,Sora成为了备受瞩目的AI王牌,她发布的两个AI视频吸引了大量目光。然而,就在2月接近尾声时,另一位视频生成“选手”也出现在我们的视野中,给人们带来了惊喜!阿里最新推出的视频生成框架是EMO(EmotePortraitAlive)。EMO基于扩散模型,只需提供图像和音频,便能创造出极具表现力的肖像视频。从发布的视频中可以看出,EMO在动作、口型和表情等方面展现出色,展示了与Sora相当的“可玩性”,使得用户可以制作出许多富有想象力和创意的视频作品。EMO驱动的肖像不仅可以唱歌、口
-
完全由AI研发的药物马上将要上市了?!由AI制药公司InsilicoMedicine开发的治疗肺部纤维化的药物TNIK已经进入二期临床试验。研究团队的在Nature子刊上发表了最新的研究成果。论文地址:https://www.nature.com/articles/s41587-024-02143-0#Sec14该论文详细描述了一个名为INS018_055的药物研发过程。这种药物是InsilicoMedicine利用他们开发的AI平台PHARMA.AI发现的潜在治疗方案,用于对抗一种罕见但致命的肺部纤维化
-
Grok-1官宣开源不过半月,新升级的Grok-1.5出炉了。刚刚,马斯克xAI官宣,128K上下文Grok-1.5,推理能力大幅提升。并且,很快就会上线。11天前,Grok-1模型的权重和架构开源,展示了Xai在去年11月之前取得的进展。Grok-1有3140亿参数,是Llama2的4倍大,而且采用的是MoE架构,8个专家中2个是活跃专家。Xai介绍,也就是从那时起,团队改进了最新模型Grok-1.5的推理和解决问题的能力。OpenAI前开发者关系负责人表示,从xAI重大发布的时间可以看出他们前进的步伐
-
语言模型是对文本进行推理的,文本通常是字符串形式,但模型的输入只能是数字,因此需要将文本转换成数字形式。Tokenization是自然语言处理的基本任务,根据特定需求能够把一段连续的文本序列(如句子、段落等)切分为一个字符序列(如单词、短语、字符、标点等多个单元),其中的单元称为token或词语。根据下图所示的具体流程,首先将文本句子切分成一个个单元,然后将单元素数值化(映射为向量),再将这些向量输入到模型进行编码,最后输出到下游任务进一步得到最终的结果。文本切分按照文本切分的粒度可以将Tokenizat
-
该团队的新模型在多个基准测试中都与GeminiPro、GPT-3.5相媲美。如果你经常读AI大模型方向的论文,YiTay想必是一个熟悉的名字。作为前谷歌大脑高级研究科学家,YiTay为许多知名的大型语言模型和多模态模型做出了贡献,包括PaLM、UL2、Flan-U-PaLM、LaMDA/Bard、ViT-22B、PaLI、MUM等。根据YiTay个人资料统计,在谷歌大脑工作的3年多的时间里,他总共参与撰写了大约45篇论文,是其中16篇的一作。一作论文包括UL2、U-PaLM、DSI、Synthesizer
-
在机器人技术的动态格局中,移动控制机器人将重新定义跨行业的效率、多功能性和创新。移动控制机器人市场规模预计将从2023年的101.7亿美元增长到2028年的198.1亿美元,预测期内复合年增长率为14.26%。这种快速增长趋势是由推动移动控制机器人的应用和发展的多种因素共同支撑的。移动控制机器人广泛应用于各个行业,如制造业、农业、医疗保健等等。它们能够在不同的环境中自由移动,并完成各种任务,具备灵活性和智能性的特点。制造业是移动控制机器人的一个重要应用领域。移动控制机器人可以在生产线上执行不同的任务,如物