前段时间和一个医生朋友吃饭,聊到他最近几个月开始接触病历夹,觉得超级好用。我问他哪里好用,他给我讲述了他,做为多点执医的工作,要经常到处跑,使用OCR和语音录入快速整理病历,有效跟踪病人的经历。这里有个背景交代一下,作为一个技术工匠,我自己不是一个很擅长推销的人。所以身边好朋友即使知道我在做什么,也知道我的性格,如果他们自己没有发现优势,是不会推荐他们用的。这次和我这个朋友吃饭,他夸的我自己都有点不好意思。但今天回想起来,心里却是觉得美滋滋的,一种功夫不负有心人的感觉。做为工匠,我理解最重要的是对“完美”的追求。在病历夹过去的2年时间里,身为技术的负责人,在语音识别和图片识别方面投入了巨大的精力。从寻找合作商,到研习友商和国内、国际上的方法,再到如今,一步一步在公司一群兄弟的“打骂”中,一点点优化系统。从最开始大量的人工识别,全病历识别到如今,经历2.5次大规模的系统更迭,几十个迭代上线,杏树林的识别系统已经初步实现了自动化分类分拣、中转流程自动化、以病历信息安全为基础的碎片化处理、信息的预OCR处理+分角色人工录入校验的一体化系统。这一系列的工作,不是一蹴而就的,也不是靠纸面能想出来的。它是一种工程技术和识别科学技术相结合的体系化工程。它是一种从实践到优化再到实践到优化持续不断的过程。可以说,强大的健康医疗类数据处理能力,在成立5年后的今天,已经成立杏树林站在大数据风口上的重要核心力量。因为这样的能力,我们那个月处理几千万字符的医疗健康数据。因为这样的能力,我们积累了中国可能少有的动态标准化医疗数据库,希望有朝一日成为国内最大的标准化数据库。因为这样的能力,我们为数据分析和研究打下了坚实的结构化数据基础,并且在持续的算法和人工清洗中,让数据称为进行精准化医疗基石。这里必须多说一句,感谢陪我走过这艰苦日子兄弟们,一起加班加点工程师、把我主持的一个个系统说的体无完肤数据分析师、争执争吵不停的算法工程师们。
说了些自夸的话,主要想顺着这个话题聊聊技术驱动医疗这个事情。互联网的发展,让越来越多的人们认识到技术在现代社会发展中起到的重要作用,工程师文化在成为了越来越多企业津津乐道的话题。那么针对医疗,是否真的能再次摇动起信息技术驱动的大旗让医疗进入新阶段吗?
互联网+医疗的门槛-医疗信息化vs信息化医疗
见过不少的HIS系统(Hospital Informatioin System),也曾经以前作为咨询师参与过朋友HIS的系统分析工作。就我所看到的,大量的医疗信息化系统,都是基本上完全照搬的现有医疗的实际工作方法或者工作模式。更多的人把计算机信息化当作了服务于原始工作的一种手段和工具。所以,曾经有一段时间,不光是医疗领域,在很多领域都流行一个词,叫做信息化或者数字化。而HIS也是在这段时期应运而生。但HIS本身,过分强调将已有医疗进行数字化,强调还原所谓的“医疗习惯”,因此造就了一系列其实很严重的数据结构。如上图,数据因为不符合关系型数据的存储,造成了大量医学统计上的困难。这种怪异的表格设计,从人类认知理解上并没有太大问题,但是作用到机器上就会出席比较大的麻烦。为什么会造成这种现象呢?在笔者看来,就是所谓医疗信息化在作祟。信息技术应该是一门重要的学科,它的重要作用是帮助人们重新认识这个世界。用机器的方式对世界进行组织和计算,这里面虽然会产生冗余,但是因为机器的大规模自动化应用,将是的大量数据的集体计算能力得到非常大的提升。
所以笔者提出了信息化医疗的理念,这也是为什么说信息技术驱动医疗。原因在于,信息的信息化技术更加强调改造一种旧有的方法和工作模式,通过大量机器的参与,大幅度的提升旧有模式的工作效率。因此,在提到移动医疗的门槛时,笔者经常会说,这里的最重要门槛是使用新时代的信息技术方法,对医疗工作过程,方法进行重新梳理和重新定义,帮助医疗系统寻找方法进行优化。而不是遵从现有医疗方法,找一个电子化的道路,这样是不可能解决问题的。
互联网+医疗的创新-业务创新vs技术创新vs技术化创新
以Google为首,创立了新的数据分类检索的搜索算法。以Facebook为首,创立了新的人与人的连接算法。以Apple为首,创立了新的人与机器的交互技术。这几件事情,是笔者认为具有跨时代意义的技术发展,他们可以说是真正的技术创新。当然正在到来的无人机远程图像传输技术、AR/VR技术等,也可能正在成为具有划时代意义的技术提升。但是有不少人说,不能所有公司都围绕着技术本身来进行创造性工作。是的,各行各业也都需要许多的业务创新。但是如今,在互联网的时代,任何的创新,或者说基础创新工作,还是有章可循的。这个章,就是对技术改变传统方法的总结和实践。用这套新的方法,来指导创新。因此笔者强调技术化创新,并不是认为互联网时代的引领者一定要做什么前无古人的新技术,也不是传统模式里面寻找新的业务增长点,而是从技术发展中,寻找使用革命性的技术,对领域进行创新改造。在这个过程中,实现业务价值,引导领域效能提升。因此,笔者认为,用现代化技术寻找医疗领域的增长点,是创新的关键。
互联网+医疗的明天-大数据vs数据分析
笔者最近出席一些论坛,也看了不少文章,发现有个词现在被反复提及“大数据”。这里笔者Quote一句最近特别喜欢的话。Big Data is like teenage sex:
Everyone talks about it, nobody really knows how to do it,
everyone thinks everyone else is doing it, so everyone claims为什么这么说?笔者还不敢说自己对“大数据”有多么深的造诣,但是就已有的技术理解而言,“大数据”不等于“大量数据”这是两码事。大数据是一种根据大量数据的统计结果进行分析的方法。举个例子来说,百度用大数据对地图两点之间距离进行统计分析,预测百度到家的送餐时间。这其中百度大数据使用了很好的大样本情况下的统计学方法。这套方法,其实在医学领域早就已经有所使用,但是这里面有一个重要的问题。现代医学有一个重要的概念,叫做循证医学,其核心思想是医疗决策(即病人的处理,治疗指南和医疗政策的制定等)应在现有的最好的临床研究依据基础上作出,同时也重视结合个人的临床经验。
这个临床依据怎么来,就成了现代医学的最重要课题。于是现代医学研究,包括药理分析,开发出了一大套排除干扰,单一化的统计方法来完成数据的分析工作。这里很重要的一个词,叫排除干扰。而恰恰是这个词,和大数据的模糊化统计理念有出入。所以,有不少人说大数据是医疗的明天,这点笔者很难认同。原因恰恰是技术驱动互联网+医疗。因为如果是驱动,就要看看被驱动本体到底是什么。如果如笔者所说,大数据是一套统计方法论的话,那么除非医疗统计方法论出现了革新,否则很难说大数据是医疗明天这样的事情。
那么明天到底是什么,在笔者看来要技术驱动,就要驱动信息化的医疗自身工作,那就是研究数据分析的过程,这一块儿虽说很难,但却是可以、也值得解决。从这个角度而言,也是笔者所引导杏树林努力实现的目标。
总结下来,回到文章一开头写的。最近的信息技术互联网,可能由于某滴、某信的快速发展变得有点浮躁,好像今天做了投资,明天就能有几千万的用户,后天就能继续融资几亿,周而复始,大家就觉得技术驱动了。笔者眼里的技术,是一个持续话提升和解决的事情。人工智能这个词从上个世界70年代提出,经历了20年的起伏,10年的低潮,如今又慢慢随着技术的提升重新进入了“代表未来”的词语。如果一定要问,技术的发展模式,在笔者看来,是踏踏实实的,做好一个又一个优化,把现在需要10个人的事情,自动化起来,变成2个人。这就是技术的发展模式,来不得半点“大跃进”,来不得半点虚假。而是踏踏实实,一步一个脚印的去优化,去改造,不盲目遵从,也不妄自菲薄。这就是技术驱动互联网医疗的核心。只要有了这个核心,大部分争论其实都是伪命题而已。做好事,让医疗真的提升,才能让我们的兄弟姐妹父母子女更多人看到病,看好病。