首页 > 科技周边 > 人工智能

浙大通义联手推出慢思考长文本生成框架OmniThink，让AI写作突破知识边界

时间：2025-01-26 21:49:46 338浏览收藏

在科技周边实战开发的过程中，我们经常会遇到一些这样那样的问题，然后要卡好半天，等问题解决了才发现原来一些细节知识点还是没有掌握好。今天golang学习网就整理分享《浙大通义联手推出慢思考长文本生成框架OmniThink，让AI写作突破知识边界》，聊聊，希望可以帮助到正在努力赚钱的你。

AIxiv专栏：深度挖掘，突破知识边界——浙大通义OmniThink框架详解

AIxiv专栏持续关注学术前沿，多年来已发表2000余篇高质量文章，涵盖全球顶尖实验室的研究成果，致力于促进学术交流与传播。欢迎投稿或联系报道 (邮箱：liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com)。

大模型（LLMs）的快速发展推动了AI写作的进步，但现有方法，如检索增强生成（RAG）和角色扮演，在深度信息挖掘方面仍有局限，难以突破既有知识框架，生成的文本往往深度不足，缺乏原创性。

为此，浙江大学通义团队推出了慢思考长文本生成框架OmniThink，通过模拟人类写作中的反思与扩展过程，突破知识边界，生成更深入、丰富和原创的内容。该框架适用于综述写作、新闻报道和报告生成等场景。

论文题目：OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking
论文链接：https://arxiv.org/abs/2501.09751
在线Demo: https://modelscope.cn/studios/iic/OmniThink

挑战与突破

现有方法面临两大挑战：

OmniThink通过引入反思与扩展机制，在传统知识检索增强的基础上，增加了动态反思和扩展反馈步骤。通过对已有信息的反思，OmniThink能够识别哪些内容需要进一步扩展，哪些信息需要重新组织或过滤，有效避免信息碎片化，实现更深层次的知识整合，从而提升文章的知识密度和创新性。

工作流程

OmniThink的工作流程分为三个阶段：信息获取、文章大纲构建和文章创作。

信息获取：扩展与反思

OmniThink的关键在于模拟人类学习过程的信息获取阶段，包含扩展和反思两部分：

扩展: 每个迭代阶段，OmniThink对主题进行信息扩展，从搜索引擎（例如Google、Bing或自定义知识库）获取信息，构建初步的“信息树”，并通过多轮检索对每个节点进行拓展。
反思: 扩展信息后，OmniThink对已获取内容进行反思和过滤，提炼核心见解，更新到概念池中，形成对主题的动态理解。

大纲构建与文章创作

构建文章大纲是关键步骤，一个好的大纲确保文章结构清晰，逻辑严谨。OmniThink首先构建初步草稿大纲，然后结合概念池中的核心信息进行优化，最终形成结构化大纲。文章创作阶段，系统根据大纲，获取相关信息并生成各个部分内容，最后进行去冗余和修正。

实验结果与分析

研究者使用WildSeek数据集评估OmniThink，并与RAG、oRAG、STORM和Co-STORM等基准方法进行对比，包括自动评估和人工评估。