作者丨刘杨楠
编辑丨巴里
图源丨文心一言
无论是早些年的信息化,还是今天的大模型,技术改变世界的宏大叙事里,医疗或许都是最难啃的“硬骨头”。
数据壁垒高筑、场景复杂多变、容错率趋近于零......但因其内含的巨大商业价值和社会价值,多年来都吸引着无数创业者奔赴其中。
2016年创办左医科技的张超,便是其中之一。张超毕业于电子科技大学,曾经担任百度NLP知识挖掘方向的负责人、知识图谱专家,也曾任新国大的研究助理。
左医科技是一家知识图谱和医疗大模型协同驱动的医疗科技公司,其客户已经覆盖全国200多家三甲医院,其中40%是top100的医院,包括北京协和医院、武汉同济医院、中国医大一院、四川省人民医院、重庆医科大学附属儿童医院等。
创业十年,张超从未离开技术一线,他几乎能敏锐捕捉到每一次技术转折的信号,却也无法跳出医疗科技变现难的普遍困境。
踩了无数坑之后,张超深知:“一件事能不能做成,时机很重要。”
在“AI医生”这个最火热的新趋势里,他延续着一名技术创业者对技术路径的敏锐嗅觉,押注“端到端+场景”深度结合的技术路线。同时,他也用更多精力钻研商业模式,试图在传统的医疗服务模式之外,给公司探索更多商业想象。
一、押宝“端到端”2020年,左医科技第一次尝试把Transformer用在医患对话上,开发了一款智能问诊程序,内部称之为“AI Doctor(AI医生)”。
张超自己也眼前一亮:“亲身体验后会发现,在Transformer出现之前,所有的人机交互都很‘傻’。”
后来,张超带团队尝试在GPT-2上做微调,发现效果不错,但成本太高,加之GPT-2参数规模较小,微调很难突破性能天花板。团队又在国内的一系列模型上尝试微调,发现效果都不理想。“当时就有些怀疑这条路线了,但现在看来是那时候国内的模型能力确实不行。”张超坦言。
时间到了2022年,在ChatGPT发布前,OpenAI发布instructGPT时,左医的技术团队已经注意到其性能有很大跃升。“但我们第一反应是不信,因为谷歌之前发了很多酷炫的demo,都没有真正落地。”张超表示,直到自己真正体验了ChatGPT,才确信AI能力真的迎来了历史性转折。
起初,左医科技曾尝试自己训练模型,但很快发现,公司很难长期支撑规模如此之大的数据和算力投入。
于是,左医科技及时停止训练,转而在开源模型的基础上训练医疗领域的垂类模型。经过一系列测评后,左医在众多开源模型中选择了通义千问。
2023年5月,左医科技发布了医疗垂类大模型,并应用落地于四川省人民医院、北京天坛医院等百强医院。
DeepSeek出圈后,左医科技也曾尝试在DeepSeek上继续训练,但团队权衡之后,还是选择继续基于通义千问做训练。
由于LLaMA、通义千问等稠密模型引领的开源浪潮已经形成了成熟的开源生态,而DeepSeek系列为MoE架构,属于稀疏模型,其开源生态相对不成熟,原本走稠密模型路线的团队若想转换路线,就要面临更大的工程难题。另外,从实际的场景需求考虑,张超认为,对医疗场景而言,参数规模可能不需要太大。
但随着通用模型不断提升,关于“垂直模型是否会被替代”的讨论也开始沸沸扬扬。
退一步看,垂直模型之所以会引领一波小高潮,本质是因为通用模型在获取专有数据方面存在障碍,只要这个问题不解决,垂直模型就会有其特定的价值。“比如DeepSeek在医疗方面幻觉很重,表现比OpenAI o1差很多,是因为OpenAI有专门的医疗团队。”张超说。
不过,张超坦言,随着通用模型不断迭代,未来留给垂直模型的生存空间确实会越来越小,但这并不意味着要直接放弃垂类模型。“飞机比火车跑得快,但火车总能去到一些飞机去不了的地方。未来做垂类模型的人要想一想,哪些事情是通用模型做不到的。”
2024年12月23日,张超在朋友圈发布了一个左医GPT-o1版的内测视频,其医疗诊断效果相比指令模型提升15%以上。但DeepSeek-R1发布后,左医就放弃就发布该推理模型。
张超认为,参考Deep Research围绕核心场景打造端到端的应用会是未来重要的方向。
目前,AI在医疗领域的落地有三种进阶形态:提示词、工作流和端到端。
市面上很多产品都通过“提示词”或“工作流(Workflow)”来实现健康咨询的AI产品,但这类解决方案容易在多步骤流程中累积错误,降低整体准确率,也很难满足越来越复杂多样的医学场景。
张超表示:“这两条路线都需要人类参与设计,人的能力会限制智能应用的能力。而端到端推理能够让模型超越人的能力的限制。”
2024年12月,左医科技开始探索端到端训练的AI Agent,通过深度强化学习整合CoT(Chain of Thought推理)、智能交互、工具调用和知识检索等流程,让AI医生在面对真实就医场景时,能自发“想办法”查找信息和综合分析,从而做出更符合临床逻辑的判断。
“端到端推理和场景深度结合本质不是在做模型,而是把模型能力和场景数据融在一起,最终以Agent的形态呈现。”张超表示。
图片来源:左医科技
而端到端的壁垒,很大一部分在于构建数据集的能力。张超坦言:“数据清洗的过程就像‘和面一样’,水多了加面,面多了加水,本质上是一个要求熟练度的工种。”
换言之,数据清洗真正的Know-how在于,无数次实操过程中积累的“错题集”。张超举了一个形象的例子,病历是很多模型训练主要的数据来源,但真实的病历有时会写明病理,这就会给模型“漏题”,因此要把病历中解释病理的部分删去,再喂给模型。
近期,左医科技通过端到端构建的Agent已经在重庆医科大学附属儿童医院落地,双方推出了“重儿·小乙AI家庭医生”。同时,左医科技还推出了儿科循证知识库,基于国内外儿科指南、专家共识、教科书等高质量专业数据源构建,并由专业团队核验,保留清晰可追溯的引用来源;能够读懂文字、识别检查报告,并根据需要自动推荐患教视频、提供预约挂号等服务。
张超表示,知识的来源和组织形式,同样会影响RAG降低幻觉的效果。“构建高质量的RAG肯定不能简单把互联网数据堆进去。即使是学术论文,也并非全篇都有引用价值。”张超表示。
多年来,左医科技积累了多种数据来源,包括互联网数据,听译机器人采集的真实的医患交流数据,以及模型在辅助诊断过程中生成的数据。同时,左医科技会借助多年来积累的专家资源,在海量原始数据中提取最有价值的信息,一篇论文中可能只提取10条真正有价值的数据纳入RAG,以此来最大程度提升模型对知识的应用。
二、B端保利润,C端求增长毋庸置疑,“AI医生”是大模型赋予整个医疗行业的新故事,创业邦在此前的文章中曾梳理了AI医生的市场现状,可谓是“八仙过海,各显神通”。
在张超看来,AI医生在医院的落地顺序应是:全科-专科-专科专家。
从行业发展历程来看,医疗信息化的过程也是从全科逐渐向专科渗透的。但张超并未给这个结论附加太多合理性。他坦言:“一个人做什么事,很大程度上取决于他手里的资源。我们积累了大量全科数据,从全科切入是水到渠成的结果。”
目前,左医科技正在探索AI医生在专科的落地,并率先在儿科达成合作。张超透露,某种程度上,这也是一个无心插柳的结果。“重庆医科大学附属儿童医院领导非常认可这个方向,目标一致,更好执行。”张超表示。
他进一步表示,在医学界,儿科是一个很好的研究领域,因为很多罕见疾病都在儿科发现,儿童在很多疾病上症状也不够典型。但正因为它很难,所以在商业化过程中要更慎重,例如很多药都不能给儿童用。从这一点上说,儿科并非一个很好的商业化场景。
在儿科之外,左医科技还同步尝试了心理以及内分泌、妇科、呼吸科、神经内科等大内科,未来也会逐步推进AI医生在各科室的落地。
但张超透露,公司接下来会逐渐调整商业化重心。
目前,左医科技已经能够给医院提供覆盖“诊前、诊中、诊后”的全流程服务,覆盖全国200多家三甲医院,其中top100的医院达40%。但张超感受到,当前的医疗信息化市场正越来越“卷”。
“医院临床要求太高了,很多信息化技术做不到。另外,医院的用户流量在下降,医改政策变化间接导致医院收入降低,他们投入到信息化转型的每一分钱都会更谨慎,加上三甲医院等优质医疗资源本就稀缺,医院和某家合作后,其他家厂商很难再进来。”
这种情况下,部分厂商会选择“破釜沉舟”,直接给医院免费送软件,送服务。“但这样终究不是长久之计,”张超说,“甚至现在一些医院部署DeepSeek一体机都是在浪费钱,本质依然是一个很重商务的模式。软件项目必须要做到90%以上的毛利,否则一定是亏的。”
在此背景下,左医科技未来会在B端会争取更多利润,保留预问诊、分导诊、语音转写病历等标准化程度高,且客户反响好的项目,把项目“做少、做深、做精”。“你不用去追逐马,当你有一片草原,马自然会来找你。”
接下来,左医科技会重点在C端找新的增长曲线。
从2023年开始,左医就尝试以B端带动C端,基于端到端技术打造的AI医生,与宁夏中卫市、银川市、北京西城区卫健委签约,将“AI医生”升级为“AI家医”,以此逐渐积累流量和数据。
图片来源:左医科技
张超透露,现阶段,左医科技的C端产品采用会员订阅收费的模式。未来流量足够大之后,还可以探索更多商业模式,比如AI医生根据和用户的交互数据为用户推荐个性化的健康类产品。
具体到医疗流程上,张超坦言,未来会将重点放在“诊前”和“诊中”。
他进一步解释道,从用户习惯来看,诊后的主要场景是慢病管理,但除了肿瘤等疾病外,慢病大多是生活习惯导致的,简单的人机交互很难真正改变什么;从商业模式来看,慢病管理最终的受益方是政府医保基金,而医保基金分配是一件很严肃的事情。
不过,就短期来看,获取流量仍是左医科技探索C端落地的关键关卡。而如何打通C端应用的商业闭环,也是当下最困扰张超的问题。
三、一位技术创业者的自白十年前,张超还在百度自然语言处理(下文简称“NLP”)部门担任资深研发工程师、文本知识挖掘方向技术负责人以及知识图谱实体建模专家。
但张超不满足于大厂相对安稳的生活,隐隐生出创业的冲动。在公司内部一次IBM科学家的分享会上,张超偶然发现,国外有团队正在探索用NLP技术辅助医疗诊断的应用。
于是,张超产生了一个今天看来“不切实际”的想法:医疗是一个知识驱动的领域,而自己又擅长知识图谱技术,只要有足够的医疗数据,构建一个能做各种推理的概率模型,或许就能达到辅助诊断的目标。
“本质上还是觉得,手里有一把锤子,而医疗这个钉子还不错。”张超说,“毕竟连马云当时都在说,‘下一个能超越我的人,一定出现在医疗健康行业’。”
但真正启动创业后,张超发现,自己想得太简单了。当时的张超,几乎对医疗一无所知。医疗数据怎么获取,病历怎么看,诊断怎么做,甚至到了医院该找谁谈合作都一头雾水。
无奈之下, 张超从自己最熟悉的技术切入,没数据就从公开渠道爬数据。但很快,团队发现公开数据效果太差,只能硬着头皮想办法找医院要数据。
彼时正处国内医疗信息化的热潮,涌现了很多第三方医疗信息化厂商。
当时,一家肿瘤大数据平台率先向张超递出橄榄枝:“你们能不能做一个病历结构化的系统?”这是张超接到的第一个客户需求,但他发现,自己完全看不懂病历。“说白了有点一头扎猛了,我们只掌握了一些技术,但在医疗领域的认知几乎空白。”
后来,在投资人的引荐下,一位医疗销售人员加入左医。2017年,左医渐渐开始和第三方医疗信息化厂商合作,左医提供技术,信息化厂商和医院沟通提供数据。张超及团队人员也在项目磨合中逐渐积累医疗认知。
今天回看,左医做了很多超前的技术,包括目前火热的CDSS(临床辅助诊断系统)、预问诊系统、听译机器人等,但由于技术和商业环境不成熟,最终都没有引起足够的市场反响。
客观来看,医疗信息服务本质上要面临所有软件厂商都会面临的商业窘境——重商务、强定制化的项目制交付,左医一度也陷入“做得越多,亏得越多”的困境。”张超自己复盘发现,创业早期确实花了很多钱,做一些不该做的项目,找了一些本不需要的人。
“技术创业者太想用技术解决所有事情了,并且会对技术的短期进步更乐观。之前我们一直想憋个大招,总想做新的东西,觉得有了更牛的技术是不是就能改变公司的境况。”张超说。
但事实证明,至少在医疗行业,医院不只需要性能拉爆的“满血”技术,更需要保证错误率最低,且能够长期稳定供应的厂商。直到现在,左医科技卖得最好的产品仍是五六年前开发的。
而未来,更多故事会发生在C端。对于整个医疗服务行业来说,C端或许都是一个全新的世界:如何获取流量,如何维持用户粘性,如何找到合理的收费模式?一切都尚待摸索。
“对于我来说,创业没有回头路。”张超说,“一件事能不能做成,时机很重要。我们之前对时机把握得不够好,但现在我们踩了足够多的坑,市场需求也很旺盛,我相信我们接下来的路会走得更稳。”
本文为创业邦原创,未经授权不得转载,否则创业邦将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系editor@cyzone.cn。