超越OpenAI!临港实验室首发AI虚拟疾病生物学家“元生”,刷新多项纪录,破解药物靶标发现难题

发布日期:2025-06-06

    2025年6月6日,由临港实验室牵头,联合上海人工智能实验室、上海交通大学、复旦大学、MIT等研发机构,共同发布国际首个专注于靶标发现与临床转化价值评估的多智能体虚拟疾病生物学家系统——“元生”(OriGene)。基于团队构建的首个靶标发现问答基准测试集TRQA评价显示,“元生”能力显著超越DeepSeek-R1、OpenAI o3-mini等主流基座大模型,且靶标发现能力得到前瞻性实验验证,标志在科学智能体时代靶标发现领域研究范式的重大突破。



1. 问渠那得清如许许?为有“源头活水”

    靶标发现是药物研发的源头活水。其治疗潜力与可转化性的高低,直接决定了后续漫长研发周期与高昂投入的最终成败。然而这一源头领域正面临系统性挑战:全球超过90%的候选药物折戟临床试验,近半数失败可追溯至靶标选择的初始缺陷——或生物学机制证据不足,或成药路径存在根本性瓶颈。

    由于靶标发现的高度复杂性,当前主流AI技术尚难有效介入,仍主要依赖经验丰富的疾病生物学家通过广泛的文献研读、组学数据挖掘与分析,再转化成生物假设进行多轮实验验证。

    针对上述挑战,“元生”通过协调多个专业智能体,对包括多组学信息、临床数据和文献专利证据等多模态数据进行推理,从而系统化地、大规模地识别原创性治疗靶标。通过自我进化框架,“元生”能够持续吸收人类专家和湿实验反馈,迭代优化其核心分析流程和工具组合,从而在精度与效率上持续进化。


2. “元生”:重新定义AI赋能下的靶标发现研究范式

  “元生”系统以专业疾病生物学家的思维模式与分析方法为核心设计理念。基于这一原则,“元生”构建了多智能体协同决策架构,包含任务协调器(Coordinator Agent)、策略规划器(Planning Agent)、科学推理器(Reasoning Agent)与批判验证器(Critic Agent),实现从靶标假设生成到临床转化评估的闭环自主化科学决策。如下图所示,系统运行遵循三层递进式工作流:首先,系统基于包含领域专家知识和模型实践经验的疾病生物学思维模板库,将复杂生物医学问题拆解为可验证的子任务,确保研究逻辑符合领域规范;其次,根据子任务需求动态调用专业工具和数据库,构建任务导向型智能体;最后,系统通过多模态证据融合推理,生成原创生物假说,并输出具有机理可追溯性的决策路径图,反馈给实验人员进行验证。


“元生”模型流程


    在该流程中,“以疾病生物学专家为师”的设计思想体现在以下方面:

(1)像疾病生物学家一样“思考”:思维模板是一类从生物医学文献中提取的研究范式逻辑架构,可为查询分解、工具选择等环节提供定制化逻辑约束。为了保障问题拆解、推理过程的合理性,研究团队从海量专业文献中提取“思维模板”,使得系统在工作中能模拟专家思路,避免传统大模型常见的“幻觉”等现象。

(2)像疾病生物学家一样“工作”:在工具接入方面,研究团队重点纳入领域专家常用工具,涵盖基础生物学、疾病生物学、药物发现及竞争格局等四大领域,共计500余种工具和数据库,极大程度复现了疾病生物学家的专业能力。

(3)像疾病生物学家一样“成长”:正如人类专家通过实操积累经验,提升熟练度一样,“元生”也拥有双层进化机制:第一层是针对单一问题的动态优化;第二层是依赖思维模板的迭代更新实现模型系统能力的进化,从而实现了无需重新训练即可自我演化,在实践中不断提升模型性能。


3. 在首个“靶标发现”基准测试集上实现最佳性能

    为标准化评估“元生”系统的实战能力,研究团队构建了领域内首个靶标发现专用基准测试集(TRQA),涵盖1 ,921道多维验证题,包含文献解析(TRQA-lit)与竞争格局分析(TRQA-db)两大模块,全面考察系统在生物学机制推断、临床转化评估等核心场景的认知能力。


靶标发现问答基准测试集TRQA构建流程


    基于TRQA测试显示“元生”在多种关键性能上均处于领先地位:

(1)文献深度解析能力:在TRQA-lit测试中,“元生”以60.08分(多项选择)与82.76分(简答)双项领先,不仅超越DeepSeek-V3、GPT-4o等顶尖大模型,更首次在生物医学专业领域系统性超过使用搜索引擎辅助的人类疾病专家组;

(2)竞争格局洞察精度:面对药物研发管线、临床试验等结构化数据分析任务(TRQA-db),“元生”以72.05分显著优于Claude-3.7与GPT-4o-search,展现跨数据库的精准决策能力;

(3)泛化性能验证:在GPQA(复杂科学推理)、DbQA(结构化数据交互)、LitQA(文献理解)三大公共基准测试中,“元生”分别以78.20分、50.00分、70.85分全面领先业界主流模型,证实其生物医学认知能力的普适优势。


“元生”在不同场景基准测试中显著超越主流基座模型与人类专家


4. 实战突破:自主发现肝癌与结直肠癌新型靶标

    实验是检验模型能力的金标准。为此,研发团队与中山医院合作,围绕肝癌与结直肠癌两种疾病类型测试“元生”提出原创靶标的能力。

    在肝癌治疗研究中,“元生”系统通过多组学数据智能挖掘,首次锁定G蛋白偶联受体GPR160为关键靶标。该系统自主完成全链条验证:临床数据分析显示GPR160在肝癌组织表达量较正常肝组织提升,且高表达患者无复发生存率显著降低;实验验证其小分子抑制剂对Huh-7细胞系具有强效抑制作用;更令人瞩目的是,实验结果显示,该靶标阻断可激活T细胞免疫应答,揭示“直接杀伤+免疫调节”双效机制,可能是全新的免疫检查点,并最终在3例患者来源肿瘤片段模型、12例患者来源类器官中均观察到显著抑瘤效果,为肝癌精准治疗开辟新路径。


元生未配对的括号或引号!通过与人类专家多轮交互发现肝癌新型靶标GPR160


    针对结直肠癌治疗瓶颈,“元生”从竞争靶标中智能优选精氨酸酶ARG2。临床证据显示ARG2在癌组织特异性高表达,系统自主设计验证闭环:首轮在HCT116细胞系确认抑制剂的剂量依赖性抑制,继而根据反馈自主升级实验方案,在4例转移性患者PDO模型中实现强效的抑瘤响应。这种从分子机制到临床模型的自主验证能力,为结直肠癌靶向治疗转化扫清关键障碍。

    上述实验表明,“元生”系统在科学家和实验的迭代反馈下已具备发现原创靶标的能力。


5. 未来计划:九万扶摇自今始

“元生”模型的发布,是征程的起点,而非终点。未来,研发团队将持续拓展合作广度、强化“元生”内核,通过优势协作,将其打造为真正能在药物研发中担当重任的“虚拟疾病生物学家”。最后的目标,是持续产出高价值靶标,为新药研发注入生生不息的“靶标活水”。


论文链接https://www.biorxiv.org/content/10.1101/2025.06.03.657658v1.full.pdf

项目主页https://gentel-lab.github.io/OriGene-Homepage/

代码仓库https://github.com/GENTEL-lab/OriGene


附件下载: