GPT-Rosalind 与执行层 · LifeSciBench 深度解读

它是什么

一个面向企业级生科研究的模型系列

GPT-Rosalind 系列"专为企业规模的生命科学研究而生"。这次更新把 GPT-5.5 的智能体编码与工具使用能力，与药物化学、基因组学等核心领域更强的模型智能结合，并推进了在更广的分析、设计与实验工作流上的表现。OpenAI 的说法是：生科进步依赖于跨尺度、跨模态地综合数据与证据——分子、基因、通路、活体系统。

怎么拿到

目前以 research preview 形式，通过"受信任访问（trusted-access）部署结构"面向全球合格机构开放。详见下方访问条款。

不止 LifeSciBench

三个配套子基准

除了 LifeSciBench，OpenAI 还用三个更聚焦的基准评估 GPT-Rosalind——而且在提分的同时普遍更省 token。

基准	考什么	GPT-5.5	GPT-Rosalind	token
MedChemBench	药物化学：多模态化学结构理解、构效关系(SAR)、活性/毒性/ADME 预测、多参数先导优化、逆合成	25.1%	27.5%	−7.2%
GeneBench	基因组与定量生物学的长程、端到端智能体分析：规划分析、QC、建模、纠错以得出决策相关答案（功能基因组、空间转录组、蛋白组、表观组、应用遗传学）	20.4%	21.6%	−31%
LabWorkBench	真实湿实验方案：把"扰动"连到"实验结果"，从排障到优化（数据为专有、未受污染）	55.8%	63.2%	−5.3%

"token"列为 GPT-Rosalind 相对 GPT-5.5 的 token 使用变化（负数=更省）。GeneBench 在准确率更高的同时省了 31% token，对长程基因组分析尤其有意义。

执行层 · 核心

两个插件：把证据检索、生物解读、生信执行放进同一个工作台

📚

Life Sciences Research

带来源标注的证据检索与生物学解读——把外部文献/数据库证据，连到你内部的组学分析上。

🧮

Life Sciences NGS Analysis

生信执行层：把测序数据的处理跑成可复核的产物，全程保留 artifacts 与 provenance（来源/溯源）。

谁能用

所有用户现在都能通过 Codex 使用这两个插件；合格的 GPT-Rosalind 企业用户还能额外用 GPT-Rosalind 来驱动这两个插件。

执行层 · 查看器

Codex 里的生物原生文件查看器

为了让 Codex 成为科学家的动态工作台，OpenAI 加入了针对生物原生文件类型的交互式查看器——首批是序列、比对、结构三类。设计目标是：当 GPT-Rosalind 在一条工作流里推理时，让科学家始终贴近证据，并能就当前查看器里的内容直接追问。

执行层 · 演示

一个端到端例子：液体活检 → 锁定 KRAS G12C

官方演示（由 GPT-Rosalind 编排）

跟随一位科学家调查一份液体肿瘤活检，以找出可指导治疗的突变与分子变化：

NGS Analysis 插件把对已处理 ctDNA 记录的审阅，变成一个交互式 notebook，浮现反复出现的变异、低频 call 与样本轨迹，把调查聚焦到 KRAS G12C；
Research 插件补上带来源的靶点、抑制剂、耐药背景；
原生序列/比对/结构查看器让科学家直接检视突变残基 12、它在 RAS 家族中的保守性、以及抑制剂结合的口袋；
工作流以"把证据翻译成具体的后续选项"收尾，每一步与每个产物都可供专家复核。

NGS Analysis 插件的两个具体能力

scRNA-seq 质控与注释

把一个 10x 风格的矩阵包，变成质控过滤后的单细胞产物、注释与 UMAP，可在 Codex 里检视与修订。插件把请求路由给 scrna-seq-qc，从数据本身选 QC 阈值，在过滤与注释环节保留 provenance，并把"缺少 doublet 检测依赖"之类的阻塞点主动暴露出来。

Bulk RNA-seq FASTQ 质控

把样本表 + FASTQ 包 + 参考文件，变成一个质控复核过的 counts 包，可在 Codex 里检视复用。插件路由请求、校验输入，并返回一个可审计的运行信封：含 MultiQC、Salmon 矩阵、provenance 与明确的注意事项(caveats)。

访问与合作

受信任访问，而非公开开放

GPT-Rosalind 系列以 research preview 形式、通过受信任访问部署结构，面向全球合格机构开放。门槛是：在做有明确公共利益的正当科研、有强治理与安全监督、且具备企业级安全的受控访问。

合作方 · Novo Nordisk

"生命科学研究复杂、数据密集、跨学科。要真正为研究者带来价值，先进 AI 模型必须扎根于可信的科学数据、连接到经过验证的工具、并融入研究者每天真实使用的工作流。我们对与 OpenAI 的合作感到满意，期待探索 GPT-Rosalind 如何支撑更严谨、更务实的药物发现路径。"

—— Mishal Patel，集团副总裁，AI & 数字创新，研发部，Novo Nordisk

OpenAI 还为没有企业账户的合格机构，提供一个由 OpenAI 托管的工作空间(managed workspace)。

下一步

官方接下来要做什么

继续提升模型的生物学推理；
扩展对工具密集、长程科研工作流的支持；
与各地区合格机构合作，评估真实世界影响——也即把基准成绩连到真实部署研究上（见成绩页的"局限"）。

← 实测样例下一页：对你的意义 →

从"会推理"到"能执行工作流"

一个面向企业级生科研究的模型系列

三个配套子基准

两个插件：把证据检索、生物解读、生信执行放进同一个工作台

Life Sciences Research

Life Sciences NGS Analysis

Codex 里的生物原生文件查看器

一个端到端例子：液体活检 → 锁定 KRAS G12C

NGS Analysis 插件的两个具体能力

scRNA-seq 质控与注释

Bulk RNA-seq FASTQ 质控

受信任访问，而非公开开放

官方接下来要做什么