首页 > 科技周边 > 人工智能

TOMG-Bench：大语言模型开放域分子生成新基准

时间：2025-02-20 11:10:09 230浏览收藏

今日不肯埋头，明日何以抬头！每日一句努力自己的话哈哈~哈喽，今天我将给大家带来一篇《TOMG-Bench：大语言模型开放域分子生成新基准》，主要内容是讲解等等，感兴趣的朋友可以收藏或者有更好的建议在评论提出，我都会认真看的！大家一起进步，一起学习！

TOMG-Bench：评估大语言模型开放域分子生成能力的新基准

科学家们开发了一个新的基准测试——TOMG-Bench，用于评估大型语言模型 (LLM) 在分子领域的开放域生成能力。该基准测试旨在弥补现有分子-文本数据集的不足，更准确地评估 LLM 在实际分子设计中的应用潜力。

项目资源：

项目主页：https://phenixace.github.io/tomgbench/
数据集和测试脚本：https://github.com/phenixace/TOMG-Bench
预印本：https://arxiv.org/abs/2412.14642
Huggingface 数据集：https://huggingface.co/datasets/Duke-de-Artois/TOMG-Bench
PaperWithCode：https://paperswithcode.com/dataset/tomg-bench

挑战与机遇：

传统的分子发现方法效率低且成本高。虽然图神经网络 (GNN) 等 AI 工具展现出潜力，但其泛化能力和生成特定性质分子结构的能力有限。LLM 强大的语言理解和生成能力为分子发现带来了新的机遇，但分子与文本数据的对齐仍然是一个挑战。现有数据集通常是目标导向的，无法满足化学家在实际工作中对模糊需求的多种解决方案的生成。