数据分析员:被忽视的“金矿”
课程导航
数据分析员:被忽视的“金矿”报名
数据分析员:被忽视的“金矿”新闻
数据分析员:被忽视的“金矿”环境
热门课程:
400-888-4846
  • 学校新闻

数据分析员:被忽视的“金矿”

  在医疗大数据被炒翻天的现在,大多数的移动医疗只是做一些边缘性的工作,所获取的数据也多为行走步数、锻炼频次和强度、心率血压血糖、膳食数据和药店或App购药信息,并没有能够切入医疗的核心流程。与其继续等待,不如换一种获取数据的思路—医院信息。
 
  根据卫计委公布的数字,2014年前11个月全国医疗卫生服务机构诊疗量(门诊和住院)达到67.7亿人次,其中三级医院接收了12.1亿人次。全年全国诊疗量估计超过76亿人次,相当于*在去年平均每个人在医院留下了5次个人身体健康信息。而这些信息有非常大的价值,它包含了患者的人口统计学信息、诊疗信息、用药信息和费用信息,而这些信息又为流行病学研究、循证医学研究、医保控费标准制定、新险种开发和药品研究及精准销售提供了基础数据。
 
  三级医院信息化率超过60%
 
  医院信息主要储存在HMIS和CIS两大系统中。HMIS(Hospital Management Information System,医院管理信息系统)的主要目标是支持医院的行政管理与事务处理业务,提高医院的工作效率。HMIS偏重医院管理,以医院各级管理人员为服务对象。CIS(Clinical Information System,临床信息系统)的主要目标是支持医院医护人员的临床活动,收集和处理病人的临床医疗信息,为病人提供更好的服务。CIS偏重临床服务,以病人为中心,以医护人员为服务对象。常见模块包括门急诊挂号系统、医生工作站系统、护士工作站、影像归档和通信系统(PACS)、实验室系统(LIS)、药物咨询系统等。
 
  现阶段大多数医院已完成了配置CT、MRI和网络存储,这些基础的软硬件相当于骨骼。有超过半数的医院已配置了HMIS和CIS,医疗信息以分散和非结构化的形式存在于HMIS和CIS的各个模块中,如ERM,HIS,LIS等,这些分散的模块相当于人体的肌肉。可以想象,在经济发达地区的三甲医院中,信息系统的覆盖率会更高。
 
  数据、规则、覆盖率是三大竞争壁垒
 
  待这些基础设施搭建完毕后,下一阶段医院的投入会集中在建立汇集各模块的集成平台和将信息结构化为可搜索可统计的数据上。
 
  那么是不是信息系统的覆盖率上去了,医疗数据就可用了呢?并不是。医院的医疗数据必须要去掉患者姓名等敏感信息,经过标准化和结构化之后才能用于统计分析,并且只有当数据量达到一定量级之后才有统计分析的意义,而目前医院的信息孤岛问题显著,严重制约了数据的利用价值。信息孤岛产生的主要原因是医院对病人数据安全性有所顾虑,另外,医疗体制的预算和支付制度、病种编码、收费代码、以及药品和耗材数据库标准不一,也为打通数据增加了难度。加上同一家医院内HMIS和CIS各模块常由不同厂商提供,模块间的数据整合也很困难。医疗大数据的门槛主要体现在以下三点:
 
  1)数据的开放性、数据结构化的深度。
 
  即是否能将医院内大量分散的信息整合,再把这些以文本形式存在的信息准确地识别并拆分,并且赋予这些词、词组和数字以逻辑关系。这种全结构化的数据库由于覆盖信息面广,数据结构程度高,可以按照病人、政府、医院、保险和药企的不同需求提供更精准的信息,做到“指哪打哪”,从而更好地帮助政策制定、市场营销和医疗服务。
 
  2)数据应用规则的*性和可信性。
 
  数据本身不直接带来价值,还是要看*终的应用场景。对于医学数据的应用来说,能否促动数据专家和医学专家参与到产品的设计中来,*终的产品不管是临床决策辅助系统还是医保控费系统,能否得到临床一线工作者和医药经济学家的认可,是区分产品优劣的关键点。有志于探索人工智能在医疗诊断方面应用的诸位英雄,除了团结一批临床工作者外,还需要在团队里配备人工智能的*专家。
 
  3)打通各级医院之间的孤岛。
 
  单一医院的数据虽然有价值,但是由于它不能反应出一个个体连续的医疗记录,且样本量小(特别是对于不特别常见的疾病来说),往往不能作为决策参考二次利用,这时如能取得一定区域内多个医院的数据,不仅有“圈地”效应 – 医院替换掉现有的数据结构化应用是有成本的,还能扩大样本量,提升医疗数据变现的可能性。
 
  可以想象得到,医疗数据还有很长的路要走。