新闻资讯
首页 > 新闻资讯 > 行业资讯
“伊”探究竟 3 | 16 万例数据训练出的科研“大脑”,正在重塑科学发现的方式
发布时间:2025-10-28

当算法不再只是工具,而成为科研的“共创伙伴”,生命科学的边界,正在被重新定义。在上一篇(“伊”探究竟 2 | 破局之战:从“测量”到“理解”,医疗大数据的下一站)中,我们提出了“NMR提供全景数据,Transformer提供系统智能”的破局之钥。


本期,我们将走近伊丽莎™科研大模型——看这个经过 16 万例数据训练的“科研大脑”,如何成为您突破研发瓶颈的核心引擎。


微信图片_2025-10-31_165457_015.jpg


Part.1   不止于模型:                    微信图片_2025-10-31_163907_086.png

             一位懂生命的“科研伙伴”


我们习惯把AI模型看作“算法”或“工具”。

但伊丽莎™的底座,不只是冷冰冰的程序——

它更像一位经过顶级医学院训练、

拥有深厚“生物学常识”的专家医生。


通过对 16 万人次血浆/尿液NMR样本(含 10 万+健康人队列)的预训练后,伊丽莎™已经:


▲ 建立了精准的“健康基线”: 

    深刻理解健康人体内分子信号的正常波动范围,能有效过滤个体差异与噪音干扰。


▲ 学习了“生物分子语言”的语法: 

    掌握分子间协同、拮抗、互作的潜在规律。


▍这意味着,您面对的不是一个“模型”,

▍而是一位能读懂分子语言的科研伙伴。


Part.2   技术内核:Transformer如何微信图片_2025-10-31_163907_086.png

           “思考”生命复杂系统


伊丽莎™采用与ChatGPT同源的Transformer架构,但它的训练语言,是人类最复杂的语言——生命本身。


“注意力机制”:捕捉分子间的“量子纠缠”



传统模型如同只能逐字阅读的读者,难以把握段落的整体含义。


伊丽莎™则能像一位高效的专家——

能同时扫描整张NMR谱图,

计算每个信号与所有信号的关联强度,

自动聚焦于与疾病或生理状态最相关的分子组合。


▍即使单个分子变化微小,

▍它也能洞察到背后的系统信号。


“并行处理”:从“串联计算”到“并联洞察”



过去,我们常说:“要算一个人,得算五十年。”

现在,Transformer让这变为几分钟。

凭借强大的并行计算能力,

它能快速解析海量分子之间

高维、非线性的相互作用,

系统级生物标志物的发现成为可能。


▍这正是AI“思考”生命的方式 ——

▍从碎片化观察走向系统性理解。


微信图片_2025-10-31_165503_309.jpg


Part.3   预训练+微调:                  微信图片_2025-10-31_163907_086.png

            让科研“站在巨人肩膀上”


伊丽莎™遵循AI的高效范式——

预训练(通识教育)+微调(专业进修)。


● 阶段一:预训练——学习生命的通用规律



● 输入:16 万例宏观人群NMR数据


● 输出:一个具备生物学常识的强大基础模型



● 阶段二:微调——针对特定疾病快速专精



● 输入:少量标注专项数据(如胰腺癌样本)


● 输出:定制化、高性能疾病模型


▍这意味着,科研人员不再需要从零开始,

▍只需几百个样本,就能在“巨人肩膀上”完成突破。


Part.3   护城河与价值: 微信图片_2025-10-31_163907_086.png

             为何是伊丽莎™?


总结而言,伊丽莎™大模型的护城河源于三者的闭环:


▲ 数据护城河:

    独家、大规模的中国人NMR数据库,是训练出精准模型的根本。


▲ 算法护城河:

    针对生物分子语言优化调校的Transformer架构,提供了强大的“系统思维”能力。


▲ 范式护城河:

   “预训练+微调”的模式,将前沿AI转化为可被快速部署的标准化服务。


微信图片_2025-10-31_165509_638.jpg


这正是LUCA™肺癌早筛模型得以快速开发并达到AUC>0.95的根基。


LUCA™只是开始,伊丽莎™的能力,将持续拓展更多疾病模型与科研方向。


在下一篇文章中,我们将以LUCA™肺癌早筛模型为例,为您详细拆解:如何利用这个强大的底座,快速构建您专属的疾病模型。敬请关注。

Copyright © 2022谱天(天津)生物科技有限公司 All rights reserved. Support by Unite talent
津ICP备17007797号-1