首页 > 科技周边 > 人工智能

无直接数据可用，AI怎么学会「干活」？微软团队揭秘AI从语言到行动的进化之路

任务计划预训练: 利用任务-计划数据预训练模型，使其掌握任务分解能力。
专家知识学习: 利用任务-行动数据进行模仿学习，让模型能够执行具体的行动。
自我探索提升: 将LAM部署在UFO框架中，通过与真实环境交互，自动生成新的训练数据，并迭代模型。
奖励模型优化: 引入奖励模型，利用强化学习进一步优化LAM的决策能力。

时间：2025-01-21 23:19:46 313浏览收藏

学习科技周边要努力，但是不要急！今天的这篇文章《无直接数据可用，AI怎么学会「干活」？微软团队揭秘AI从语言到行动的进化之路》将会介绍到等等知识点，如果你想深入学习科技周边，可以关注我！我会持续更新相关文章的，希望对大家都能有所帮助！

微软团队突破性研究：从零构建大行动模型LAM，实现AI从被动语言生成到主动行动生成的飞跃！

微软Data, Knowledge, and Intelligence (DKI) 团队（TaskWeaver, WizardLLM, Windows GUI Agent UFO核心开发者）发布技术报告，详细阐述了如何在缺乏直接可用数据的情况下，从头训练一个能够在真实环境中执行任务的大行动模型（Large Action Model, LAM）。该研究为AI从被动语言生成向主动行动生成的转变提供了全新思路。

LLM的局限与LAM的优势

当前的大语言模型（LLM），如GPT系列和Mistral-7B，擅长文本生成，但在与物理或数字环境交互方面存在局限，无法执行超越文本层面的操作。这种“语言-行动断层”限制了AI的实际应用。

LAM则具备三大关键特性：精准的用户意图理解（涵盖语言、语音、图像等多种输入）、强大的行动生成能力（GUI操作、API调用、物理动作等）、以及动态规划与环境适应能力。