2025年4月4日这天早上,北京某C9高校实验室里突然炸开锅。张教授发现他用了十年的美国癌症数据库SEER突然登不进去了,屏幕上跳出来个红色警告框,显示"访问权限已被终止"。这个覆盖美国34.6%人口的大数据库说关就关,国内75%的癌症研究项目可都指着它呢。
科研人员的"断粮"时刻美国国家癌症研究所发的邮件里说得明白,从这天开始,中国用户再也看不到里面的癌症发病率、治疗方案这些核心数据了。广州大学关跃峰教授说现在做研究就像做饭没米下锅,原先靠生物信息学筛选靶点的研究都得退回实验室试错,一个课题要多花两三倍的钱。

李果在浙江湘湖实验室急得直转圈,他的食管癌研究正卡在关键阶段。没了GTEx正常组织表达谱数据,论文里要求的对照实验根本没法做。国内替代数据库像中国生物银行虽然能用,但样本只覆盖12个省份,国际期刊总嫌"数据代表性不足"。
"备胎"数据库的秘密行动深圳国家基因库里,工程师们正连夜调试新系统。这个存着500PB数据的"国家队"每天能处理10万例基因数据,但临床信息完整度只有SEER的四成多。三甲医院的肿瘤登记系统更离谱,有的还在用2008年的单机版软件。

华为云和中科院联手搞的"神农"平台倒是有点意思。这个系统把国内50万例肝癌数据和欧盟的200万病例混着用,早期肝癌预测准确率从51%提到78%。项目负责人说这就像炒菜时加点外国调料,味道立马不一样。
暗流涌动的数据交易上海有个跨国研究组最近总往法国跑,他们和居里研究所合作搞到些乳腺癌数据。不过代价不小,得把三成研究成果署名权让给欧洲人。还有个更绝的,某公司开发的"方舟"平台用区块链技术搞匿名交易,三个月成交1200万美元的数据,九成都伪装成"数字艺术品"。

武汉光谷新启动的"中华肿瘤队列"项目动静挺大,说要收集200万病例。协和医院贡献的首批10万肺癌数据刚完成脱敏处理,听说2027年就能对外开放,到时候还能和欧盟、日本的数据库直接对接。
老教授们的"佛系"应对那位不愿透露姓名的C9教授倒是不着急,他说这事跟当年华为被卡脖子一个道理。国内数据库虽然现在比不上美国的,但就像国产芯片,7纳米做不了就用别的方法达到5纳米效果。他还神秘兮兮地说,说不定今年下半年就有新数据库面世。
关于发论文这事,老教授看得开:"我们组现在发不发《自然》《科学》无所谓,倒是那些四十来岁的副教授们头疼。评职称时人家就问,你在正刊发过文章吗?"
数据显示,国产数据库市场规模今年预计能到1286.8亿元,像人大金仓这样的企业已经能实现"0停机"数据迁移。虽然现在国际影响力还不够,但起码在金融、医疗这些关键领域站稳了脚跟。