一个面向企业级生科研究的模型系列
GPT-Rosalind 系列"专为企业规模的生命科学研究而生"。这次更新把 GPT-5.5 的智能体编码与工具使用能力,与药物化学、基因组学等核心领域更强的模型智能结合,并推进了在更广的分析、设计与实验工作流上的表现。OpenAI 的说法是:生科进步依赖于跨尺度、跨模态地综合数据与证据——分子、基因、通路、活体系统。
目前以 research preview 形式,通过"受信任访问(trusted-access)部署结构"面向全球合格机构开放。详见下方访问条款。
三个配套子基准
除了 LifeSciBench,OpenAI 还用三个更聚焦的基准评估 GPT-Rosalind——而且在提分的同时普遍更省 token。
| 基准 | 考什么 | GPT-5.5 | GPT-Rosalind | token |
|---|---|---|---|---|
| MedChemBench | 药物化学:多模态化学结构理解、构效关系(SAR)、活性/毒性/ADME 预测、多参数先导优化、逆合成 | 25.1% | 27.5% | −7.2% |
| GeneBench | 基因组与定量生物学的长程、端到端智能体分析:规划分析、QC、建模、纠错以得出决策相关答案(功能基因组、空间转录组、蛋白组、表观组、应用遗传学) | 20.4% | 21.6% | −31% |
| LabWorkBench | 真实湿实验方案:把"扰动"连到"实验结果",从排障到优化(数据为专有、未受污染) | 55.8% | 63.2% | −5.3% |
"token"列为 GPT-Rosalind 相对 GPT-5.5 的 token 使用变化(负数=更省)。GeneBench 在准确率更高的同时省了 31% token,对长程基因组分析尤其有意义。
两个插件:把证据检索、生物解读、生信执行放进同一个工作台
Life Sciences Research
带来源标注的证据检索与生物学解读——把外部文献/数据库证据,连到你内部的组学分析上。
Life Sciences NGS Analysis
生信执行层:把测序数据的处理跑成可复核的产物,全程保留 artifacts 与 provenance(来源/溯源)。
所有用户现在都能通过 Codex 使用这两个插件;合格的 GPT-Rosalind 企业用户还能额外用 GPT-Rosalind 来驱动这两个插件。
Codex 里的生物原生文件查看器
为了让 Codex 成为科学家的动态工作台,OpenAI 加入了针对生物原生文件类型的交互式查看器——首批是序列、比对、结构三类。设计目标是:当 GPT-Rosalind 在一条工作流里推理时,让科学家始终贴近证据,并能就当前查看器里的内容直接追问。
一个端到端例子:液体活检 → 锁定 KRAS G12C
跟随一位科学家调查一份液体肿瘤活检,以找出可指导治疗的突变与分子变化:
- NGS Analysis 插件把对已处理 ctDNA 记录的审阅,变成一个交互式 notebook,浮现反复出现的变异、低频 call 与样本轨迹,把调查聚焦到 KRAS G12C;
- Research 插件补上带来源的靶点、抑制剂、耐药背景;
- 原生序列/比对/结构查看器让科学家直接检视突变残基 12、它在 RAS 家族中的保守性、以及抑制剂结合的口袋;
- 工作流以"把证据翻译成具体的后续选项"收尾,每一步与每个产物都可供专家复核。
NGS Analysis 插件的两个具体能力
scRNA-seq 质控与注释
把一个 10x 风格的矩阵包,变成质控过滤后的单细胞产物、注释与 UMAP,可在 Codex 里检视与修订。插件把请求路由给 scrna-seq-qc,从数据本身选 QC 阈值,在过滤与注释环节保留 provenance,并把"缺少 doublet 检测依赖"之类的阻塞点主动暴露出来。
Bulk RNA-seq FASTQ 质控
把样本表 + FASTQ 包 + 参考文件,变成一个质控复核过的 counts 包,可在 Codex 里检视复用。插件路由请求、校验输入,并返回一个可审计的运行信封:含 MultiQC、Salmon 矩阵、provenance 与明确的注意事项(caveats)。
受信任访问,而非公开开放
GPT-Rosalind 系列以 research preview 形式、通过受信任访问部署结构,面向全球合格机构开放。门槛是:在做有明确公共利益的正当科研、有强治理与安全监督、且具备企业级安全的受控访问。
"生命科学研究复杂、数据密集、跨学科。要真正为研究者带来价值,先进 AI 模型必须扎根于可信的科学数据、连接到经过验证的工具、并融入研究者每天真实使用的工作流。我们对与 OpenAI 的合作感到满意,期待探索 GPT-Rosalind 如何支撑更严谨、更务实的药物发现路径。"
—— Mishal Patel,集团副总裁,AI & 数字创新,研发部,Novo Nordisk
OpenAI 还为没有企业账户的合格机构,提供一个由 OpenAI 托管的工作空间(managed workspace)。
官方接下来要做什么
- 继续提升模型的生物学推理;
- 扩展对工具密集、长程科研工作流的支持;
- 与各地区合格机构合作,评估真实世界影响——也即把基准成绩连到真实部署研究上(见成绩页的"局限")。