Post
脱敏医学数据的尽早公开
公共卫生与科研协作真正稀缺的,往往不是观点,而是可信、及时、可复核的一手数据。
最近有关于医疗实验数据被截获,为了发论文捂着不公布的说法,真实性先不论,等各方甩一会锅再看落到谁头上。但我有个不成熟的想法,想请这个领域的专家探讨一下。
有没有这种可能,这种一手的医学的原始数据,无论是实验数据还是临床的数据,能不能作为一种公共数据脱敏后直接公开。假设有这样一个公开的,允许任何人访问的,可以保存格式化数据结构的数据库。然后任何科研学者都可以基于这个数据库的数据进行解读分析,发表预测或者论文。
当然,对数据提供者来说,自己发论文的激励要比别人的论文引用自己的数据的激励要大,所以得同时调整当前的科研评价激励体系,对这个数据库贡献数据要和发论文得到近似的激励。其实本质的问题是科研成果中,原始的实验数据和论文是否可以成为相对独立的关系,而不是包含关系。
当然,还有一个问题是这数据库的写入标准问题。这个可以参考当前的论文评审机制,构建一套评审流程。但由于数据都是逐案提交的,评审速度应该可以快很多。
如果这个可行的话,其实就可以有这样一个区块链系统去做这个事情。节点由各科研机构共同托管,相当于一种向公众开放的公开原始科研数据的联盟链。这个想法我以前和一个医学院的朋友讨论过,当时她质疑这种数据公开的价值,但现在看来价值还是充分的。
ps:这个不是为了给区块链蹭热点,只是一个外行的软件工程师的脑洞。