笔者有过十几年的医疗信息化行业(HIT)的从业经历,一直在试图发现HIT系统的价值所在。笔者认为HIT价值主要分为数据的价值和IT系统的价值,其中又以数据的价值为重。本文就来讨论数据的价值。
笔者认为,数据的价值在于数据的内容质量和数据的被引用,两者是相辅相成的。
说到数据的价值可以首先联想到人的价值。现在社会环境中,人的价值在于人本身的能力及人脉关系,有时候人脉关系是更重要的,而人脉关系实际上就是人和人之间的相互引用。高价值的人,会被其他人频繁的引用,比如经常有人引用马云、巴菲特的话。
类似人的价值,数据的价值也是这种规律。
HIT系统的数据基本上就是病历数据,这里的病历数据是广义的,不仅包含各种门急诊临床文书,还包括各种PASC影像、各种检查检验数据等等等。
病历数据的质量包括病历质控、存储或传输格式。质控是数据质量的必要非充分条件。
病历数据的引用分为三个步骤:
第一步:数据的存储
第二步:数据的传递
第三步:数据在客户端的解析应用
这就是 “互联互通”,整个过程因素复杂多变,本文只讨论技术方面的因素。
数据的传递实现起来比较简单,比如各种前置机、中间数据库、数据上报系统等等。相比之下,数据的解析利用做得就不够好,其重要原因就是有大量的病历文档数据物理存储格式不是开放的,也就是说第一步就没做好。
数据的物理存储格式是数据引用的第一步,没有良好的开放的物理存储格式,数据即使传递出去了也没法解析利用,也就没法产生价值。这方面目前业界做得参差不齐。
对于医学影像,数据的物理组织格式都采用了国际统一的DICOM格式,这样影像数据的互联互通就比较容易了,各个组织之间的医学影像数据引用比较方便。
对于一些医嘱、护理和LIS等数据,大多存在关系型数据库中的各个字段中,由于都是采用SQL语言来访问,而且SQL语法也有国际标准,因此这些关系型数据库中的数据格式也勉强算是开放的,能做到相互引用,只是工作量繁琐。
而对于医学文书数据的引用,业界做得最差,也是今后业界最需要关注的方面。
医学文书数据基本上都是各种电子病历文档编辑器生成的,物理存储格式各种各样,有TXT、RTF、DOC、ODT、XML、HTML以及各种厂家自定义的二进制格式,甚至还有分散存在数据库字段中。有些病历文档文件还被人为加密,第三方无法解析。这种封闭格式的病历文书数据即使被引用了也是没有多少价值的。所以说医学文书数据的引用是业界做得最差的。
产生这种问题可以说是软件厂商和医疗机构共同造成的。
当前很多医疗机构对HIT认知不够,缺乏远见,对于病历文书只关注内容的录入、显示和打印,并没有主动提出医学文书数据的引用的需求,不关心病历文件存储格式。
软件厂商没有确切的病历文档数据引用的市场需求,于是也就不关注这方面,实现程序功能时就怎么方便怎么来了。
另外还有些软件厂商内部认识到病历数据引用的价值,故意对病历数据做出第三方无法解析的加密操作,绑定客户,损害客户的利益最大化。
软件厂商在开发电子病历文档编辑器时主要有两大方式:第一种是基于某种已有的通用文档编辑器上开发,另外一种就是完全自主研发。
基于已有的通用文档编辑器进行开发。最常见的就是基于MS WORD、开源编辑器控件、RichTextBox控件或者Delphi RichView控件开发。这种方式开发难度低,不过受制于通用编辑器控件底层的功能限制,一些医疗行业特有的功能就很难实现了,而且文件存储格式也大多是难于解析的二进制格式。此时编辑器不先进,整个电子病历系统就谈不上先进了。
完全自主研发编辑器,技术难度大,只有极个别公司能做得很好,一旦做好也就能持续的先进,能对医学文书数据引用提供强力的支持。先进的编辑器是开发先进的电子病历系统的必要非充分条件。
软件厂商由于技术水平有限使得软件不能产生良好开放格式的医学文书文档;还有一些软件厂商为了绑架客户,故意对病历文档进行加密,主观上阻止了文档数据被第三方引用,损害了客户的利益最大化。
由于病历文件格式的不开放透明形成的短板效应,导致了病历文件数据的引用目前做的很不好。因此推广开放的病历文件格式标准成为提高病历数据价值的关键之一。
笔者作为HIT中的一员,正在这方面做着自己的努力。笔者所在的南京都昌信息科技有限公司正在推广的DCWriter电子病历编辑器生成的文档采用完全开放透明的XML格式,而且正在促进一家一家HIT公司的采购,一家一家医院的应用,希望再努力若干年,使得基于DCWriter XML的电子病历文档存储格式成为事实上的行业标准。这样各个医疗信息化系统至少对于电子病历文档来说都是采用统一的XML存储格式,数据引用的第一步就自然能做好,为数据引用的后续步骤打下扎实的基础。
为了改善惨淡的病历数据的引用现状,卫计委是屡战屡败,屡败屡战。
此前原卫生部提出的CDA/HL7试图以一己之力来推行病历数据的格式公开透明,这是单纯的行政干预市场,结果几年下来没能普及。
而现在卫计委又提出了“互联网+”和“互联互通”来试图打通数据的引用通道。不再单纯的行政干预市场,而是借助整个社会的“互联网+”的风潮,引入社会资本,结果迅速冒出了春雨医生、卓健科技等“互联网+”的HIT企业。这次不是孤家寡人,有众多推手,卫计委的努力很快有所成就了。
提高数据的引用对整个行业具有重要的战略意义。被引用的数据不一定是最先进的数据,只要质量高于平均值,则引用得多,就能提高整体的平均质量,就能带来行业的进步。
识时务者为俊杰,当前时务就是数据和资源的整合和相互引用。现在还建设封闭信息化系统的是不识时务,是封建军阀,必然遭到广泛的抵触和淘汰。
国家和国家之间不应再搞意识形态,同样的企业和企业之间、医院和医院之间也不应该继续搞意识形态。组织内部和组织和组织之间的数据应该在保证安全的情况下做到相互引用。引用得越多,数据的价值越大。
不过只要有人就有江湖,只要有江湖就有帮派,只要有帮派就会阻碍数据的引用。这就需要有合适的市场利益分配制度以及针对性的行政干预制度来降低帮派对数据引用的阻碍,实现整个行业的利益最大化。
参考其他社会行业的发展经历,比如金融行业中各家银行之间的数据互联互通,电信行业中各个电信公司之间的数据互联互通,这些都是经过长期利益博弈以及国家行政和法律的干预才慢慢熬出来的。因此中国公立医疗体制作为比较封闭落后顽固的经济行政体制,其数据的互联互通必然也要经过各方长期反复努力才能实现。
展望未来,当病历数据的引用普遍做得比较好,互联互通得到普及,病历数据的价值将得到很大的提升。远程会诊、移动医疗、大数据挖掘等等整个HIT行业将从中受益巨大,各个医疗机构共同生产数据、各处按需使用数据的数据共产主义将得到实现。
(原题目:袁创:HIT数据的价值)
10月30日,平安医疗健康管理股份有限公司(简称“平安医保科技”)旗下沈阳平安健康(检测)中心、沈阳平安好医医学检验实验室联合开业盛典在沈阳盛大举行。辽宁省工商