DeepSeek 的出现引发了全球对 AI 大模型的新一轮热议。凭借卓越的技术突破和显著的低成本优势,其不仅吸引了亚马逊 AWS、微软 Azure 等国际科技巨头的深度接入,在医疗行业同样掀起了一场从顶层到底层的全面“AI 改造运动”。
回顾近30年的发展历程,从最初的互联网医疗、智慧医疗到AI医疗、数字医疗、数智化医疗,"AI+医疗"的趋势不断演进,尽管每次都备受期待,但实际落地效果常常未达预期。那么这一次,DeepSeek的引入将带来哪些不同的突破与变化?
作为一家专注于生命科学与医疗健康产业的VC机构,道彤投资部分family企业第一时间采取行动,陆续宣布了公司在产品或服务中全面应用DeepSeek技术的实质性进展。本文将依托他们的视角,一探DeepSeek R1大模型在医疗行业细分领域的积极性意义。
医疗影像
深睿医疗:DeepSeek 助力医疗影像智能化升级
近日,深睿医疗Deepwise TrioData多模态医疗大数据平台宣布已经全面接入DeepSeek开源大模型,进一步夯实其独有的“影像+文本”的双AI引擎,并于2月16日完成首个西南地区医院用户的DeepSeek R1模型的接入交付。
基于Deepseek R1模型在数学、代码和自然语言推理等复杂任务上的卓越性能,深睿医疗将助力机构在保障医疗大数据安全的前提下,共同开启基于国际领先大模型的智慧医疗创新探索工作。DeepSeek全面接入的积极意义具体体现在以下三个方面:
1、有利于医疗数据资产化治理
利用DeepSeek大模型,进一步强化Deepwise TrioData平台全院级多模态大数据的融合与治理能力,深度挖掘医疗体系多模态数据的价值,帮助医院进行优质数据资产管理,提供管理、科研、临床、AI能力建设等多场景的智慧化产品和服务,并构建服务于医疗全流程全场景的数字化生态体系。
2、加速多模态AI能力开放
通过Deepseek大模型构建具有强化推理能力,同时结合深睿在医学影像AI领域的深厚积累,构建“通用医疗多模态开发平台”,服务于医疗机构建设自主可控的医疗人工智能应用,提高机构自身AI能力建设,形成更加标准和系统化的科研建模能力,加速临床成果的快速转化。
3、带来全场景人工智能应用的可能性
Deepseek大模型将助力Deepwise TrioData提升创新应用性能优势能力。例如,通过集成大模型技术实现对治疗决策的强化推理,可以显著提升基于医疗多模态数据的AI-MDT系统性能,为临床医生提供更加智能和逻辑可信的诊疗决策方案。
生物医药
水木分子:DeepSeek 赋能生物医药研发
2月20日,美国 AI 巨头英伟达(NVIDIA)宣布,其与美国弧形研究所、斯坦福大学、加州大学伯克利分校、加州大学旧金山分校等科研人员联合推出开源生物学 AI 大模型Evo2,完整版拥有高达400亿参数,包含12.8万个物种的9.3万亿个核苷酸,可广泛应用于分子研究、精准医学、药物研发,合成生物等。
而就在同一天,清华大学人工智能产业研究院(AIR)与北京水木分子联合发布升级版生物医药多模态开源基础大模型BioMedGPT-R1,用DeepSeek R1蒸馏版本模型更新百亿参数规模的开源BioMedGPT中的文本基座模型,在USMLE美国医师资格考试上达到了67.1%正确率,效果逼近人类专家水平。同期上线的还有 DeepSeek 版 ChatDD-R1 模型基座——基于水木分子在2023年发布的自研千亿参数多模态生物医药专业大模型 ChatDDFM® 和新一代 AI 驱动药物发现工具 ChatDD。
1、BioMedGPT-R1:
新一代开源生物医药多模态大模型
BioMedGPT 是清华大学智能产业研究院(AIR)携手水木分子开源的全球首个可商用多模态生物医药百亿参数大模型,该模型在生物医药专业领域问答能力比肩人类专家水平,发布时在自然语言、分子、蛋白质跨模态问答任务上达到 SOTA。BioMedGPT 能够同时处理多种生物医学任务,具有广泛的适用性、更多的可能性。
在 BioMedGPT 的基础上,清华大学AIR与水木分子再次携手推出了 BioMedGPT-R1 (图1),用 DeepSeek R1 蒸馏版本模型更新了 BioMedGPT 中现采用的文本基座模型,从而引入了更优的文本推理能力。通过跨模态特征对齐,BioMedGPT-R1 实现了生物模态与自然语言文本模态在同一个特征空间的统一融合,探索了生物多模态场景下的模型深度推理能力。通过训练对齐翻译层(Translator),BioMedGPT-R1 将生物模态编码器(Molecule Encoder 与 Protein Encoder)输出映射到自然语言表征空间,从而在 DeepSeek R1 基础上增加了生物模态数据的理解能力。
图1:BioMedGPT-R1 模型框架和主要训练步骤
BioMedGPT-R1 的训练分为两个主要步骤(图1):首先,仅训练对齐翻译层 Translator,使其能将编码后的生物模态表征映射到语义表征空间;然后,同时微调对齐翻译层 Translator 和基座大语言模型,激发其在下游任务上的多模态深度推理能力。
基于上述模型架构与训练策略,BioMedGPT-R1 支持跨模态自然语言和生物语言的交互式问答推理,可应用到药物分子深度理解分析、药物靶点探索与挖掘等领域。例如,当需要了解某个化学分子时,BioMedGPT-R1 可以从分子结构、官能团组成、生化性质和可能的应用等方面逐步推理分析,最终形成文本回复(图2)。
图2:跨模态对齐后,模型实现多模态问答场景下的理解分析
生物医药从业人员日常工作既离不开文本,也离不开小分子、蛋白质等生物模态信息,BioMedGPT-R1 将“强推理慢思考”从单文本模态,进一步推广至生物多模态场景,赋能生物医药行业。
BioMedGPT-R1 在生物医药相关文本问答任务上也展现出了较优的效果,如在 USMLE 美国医师资格考试上达到了 67.1% 正确率,效果逼近闭源商用大模型和人类专家水平(图3),并在专家级医疗推理与理解评测集 MedXpertQA 上达到和闭源商用大模型相当的效果(图4),团队正在探索生物医药场景下的多个深度推理能力应用,期待让“强推理慢思考”赋能医药研发。
图3:在 USMLE 美国医师资格考试评测集上效果逼近闭源商用大模型
和人类专家水平
图4:在 MedXpertQA 专家级医学推理与理解评测集上效果
与闭源商用大模型相当
2、ChatDD-R1:
药企全流程智能化升级,显著提升药物研发效率
水木分子开发的对话式医药研发助手 ChatDD,基于分子、蛋白质和单细胞等多模态生物医药大模型,服务药物研发全流程,包括立项调研、靶点挖掘、早期药物发现、临床前研究、生物标记物发现和精准患者招募等场景。
DeepSeek 版 ChatDD-R1 是多模态生物医药大模型 ChatDDFM® 的升级版本,大幅提升了推理规划能力,为广大药企提供更强的研发能力、更高的研发效率和更低的研发成本。ChatDD-R1 与水木分子专属知识图谱结合,为药企用户提供更加专业、实时、全面的深度检索与思考;同时也与药物研发专家经验流程结合,在特定场景给予专业思路引导,例如药物竞品分析、上市药物的专利过期时间、信号通路推荐等。
在 DeepSeek 技术浪潮中,道彤family企业凭借领先的技术和创新应用,在医疗影像和生物医药研发领域已获得初步进展。未来,道彤投资将继续关注“医疗 + AI”领域的前沿技术和发展趋势。我们相信,随着 DeepSeek 技术的不断深化和应用,医疗行业将迎来更广泛的智能化变革,为人类健康事业贡献更多智慧和力量。