首页 > 科技周边 > 人工智能

「社交达人」GPT-4！解读表情、揣测心理全都会

来源：51CTO.COM

时间：2023-08-16 18:12:47 109浏览收藏

亲爱的编程学习爱好者，如果你点开了这篇文章，说明你对《「社交达人」GPT-4！解读表情、揣测心理全都会》很感兴趣。本篇文章就来给大家详细解析一下，主要介绍一下，希望所有认真读完的童鞋们，都有实质性的提高。

想象一下，您正在参加一个充满活力的鸡尾酒会，局间充满了热烈的谈话声和玻璃杯碰撞的叮当声。

此时，您作为一个悠闲的观察者，怡然自得地躲在角落里。然而，就算没有处在聚会的中心，您还是可以轻松地弄清楚不同人之间的社会关系，了解正在发生的事情，甚至通过阅读人们的言语和非言语线索来读懂明里暗里的社交信息。

如果一个LLM能够复现这种水平的社交能力呢？这不，Koko Mind就是这么个东西。

「社交达人」GPT-4！解读表情、揣测心理全都会

随便打开一个视频，该模型就开始分析人物表情，得出人物情绪的结论。

然后，在右侧的prompt栏还可以提出问题，让AI进一步分析视频中暗流涌动的社交谜题。

（说实话对有些人来说这都很难）

「社交达人」GPT-4！解读表情、揣测心理全都会图片

Koko Mind包含了150个复杂的多方社交互动以及自由文本问题和答案。

为了确保数据的多样性和可扩展性，并避免数据污染，所有社交互动、问题和答案均由GPT-4生成，并随后由人类专家验证。

分析数据基于三个不同的来源：

GPT-4-only：该子集仅由 GPT-4 通过提示创建。
基于电影：为了避免数据污染，这部分数据基于从2022年之后上映的电影中提取的各种场景。GPT-4负责塑造这些场景，在保留核心本质的同时添加了自己的元素。
基于 ToMi：该部分包含由模拟数据集ToMi支持的数据，其中涉及将物理对象移动到不同的地方，这是心理理论的经典测试。当然，这些社交互动还得被GPT-4修饰和扩展一下。

三种数据来源的占比如下：

「社交达人」GPT-4！解读表情、揣测心理全都会图片