2024 CHITEC|墙辉演讲实录-数据要素资产化实践探索

7个月前 (02-08) 阅读数 190 #科技
文章标签 大数据

导语

数据要素资产化不仅是IT系统数据汇聚,而是要超越现有IT架构,构建能够促进数据价值最大化的新模式。医院数据的复杂性和多样性要求我们在数据要素建设中采用更高层次的抽象和统一的语义建模,确保数据的通用性和可交换性。数据服务还将在医院经营决策支持和科研创新应用中发挥潜力,同时助力 AI 技术在提升医疗服务智能化水平中发挥关键作用。


7月6日下午,熙牛医疗CEO墙辉(花名:玄难)受邀出席2024 CHITEC“数据要素资产化与数据治理”分论坛,他以《数据要素资产化实践探索》为题,深入探讨了数据要素在医院信息化建设中的重要性,以及如何管理和利用数据资产以提升生产效率和质量。


熙牛医疗CEO 墙辉(花名:玄难)


以下内容根据墙辉在论坛上的发言整理。


非常荣幸今天能就“数据要素”这一议题与各位交流。前面多位专家从多个维度探讨了数据要素建设的现状及未来的展望,熙牛医疗作为一家专注于医疗卫生行业数字化的服务商,在参与数据要素构建的实践中,更多的是从实施建设的角度出发,审视过程中遇到的挑战及实践。


关于政策背景,我在此想探讨的一个核心问题是:为何近年来“数据要素”的概念被明确提出?并且,数据要素是否简单等同于IT系统内数据的汇集?


“数据要素”核心在于具备交换价值,这就清晰地区别于IT系统数据库和其它非结构化多模态数据等。回顾过去二三十年,随着计算机技术、互联网、云计算和人工智能技术的飞速发展,我们能够记录和量化以往难以捕捉的线下生产过程。这意味着通过生产过程数据的分析和再利用可以显著提升生产效率。


然而,并非所有IT系统中的数据都具备市场价值。因为其他企业感兴趣的大概率是某家医院核心业务相关的数据,而对医院很多支撑性系统产生的数据不感兴趣。只有对外部具有价值的数据才能视为数据要素,而局限于机构内部、主要用于内部绩效管理和效率提升的数据则不属于此列。


因此,在投资与提升数据价值以实现其交换可行性时,成本效益比至关重要。如果投入的成本远高于数据交换带来的价值,那么这类数据的真实价值就需要重新评估和考量。


从数据建设的角度审视,这就要求我们从不同视角去界定属于市场交换的数据要素数据、内部经营管理的数据。这对于后续建设数据中台或者大数据平台,以及数据资产入表,都有着深远的影响。


要实现数据要素的有效交易,其过程大致包含三个关键环节。


首先,是基础设施建设。目前,行业内很多医疗机构和企业在探讨数据要素时,实质上仍聚焦于传统数据仓库或数据湖的构建,即采集、整合IT系统中的数据,进行清洗与质量提升,以便再次利用。但是要将这些数据转化为可交易的数据要素,还需要引入资产评估与资产目录编制工作。


这是因为,数据要素需要有高度的可理解性,确保潜在买家能够准确解读数据结构和数据内容。这就意味着,相比以往的数据仓库构建,数据资产管理需采用更加标准化、行业通用的语言与模型,确保数据可以被跨行业、跨领域广泛理解与应用,尤其是当非医疗行业试图利用医疗行业数据时,数据的可理解性尤为重要。


最后,数据资产管理体系面临着革新需求。传统的数仓往往侧重于满足机构内部或单一行业的需求,而作为交易对象的数据要素则必须突破这一局限,采用普遍认可的标准,确保数据的互操作性和易理解性,从而拓宽其使用范围和价值空间。


现在,让我们首先探讨数据要素的基础建设。


我们知道医院的数据种类是非常繁多的。我以前做过电信、电商等行业,相较于我以前经历的行业,医疗卫生体系展现出更高的复杂性,这不仅源于其广泛的业务范畴,也体现在数据类型的多样性上,像文本、声音、图片、视频等,医疗领域数据的广度与深度均超乎寻常。当前,多数医疗机构已将这些多样的数据集纳至数据仓库中,这是对数据进行初步整合与管理的关键步骤。当我们将视角转向将这些数据转换为可交易的数据要素时,面临的挑战将与众不同。


在面对可交易的数据要素时,数据的表述需要采用普遍可理解的术语而非高度专业化的词汇,变得至关重要。这有助于数据的易获取性和实用性。而且医疗活动是在随着时间的推进不断丰富与扩展的,这意味着,构建数据要素时,应采用相对稳定的模型来描述医院及卫健体系的生产经营活动。


我们将医疗数据要素归纳为几个核心类别:首先是客户状态,了解服务对象的需求与特征;其次是生产资料与组织架构,即支撑服务提供的资源与结构;再者,是产品与服务内容及其交付形式和流程,包括各环节的操作及其对生产资料的消耗。


所有业务活动均伴随有凭证记录与成果产出,如检查申请单、检验报告、电子病历等,这些都是经营活动的具体体现。因此,我们旨在通过更高层次的抽象化,将医院的经营行为系统化地概括,确保模型随医院发展而进化,同时保持其精简性与可持续性。在这一目标导向下,数据仓库与数据湖的构建策略需相应调整,不仅目标定位不同,实施路径与方法也需要革新,旨在打造易于理解且便于二次利用的数据要素体系。


接下来,我们来看看如何将传统的医疗服务活动,如门诊、急诊、住院和体检等服务,融入到一个更高层次的抽象模型中。构建这一模型的关键在于其包容性,确保所有活动均能被囊括。为此,我们需要细致分析医院的产品与服务背后的生产资料和经营要素。


首先,审视每项产品或服务所依托的流程,明确这些流程由哪些具体的业务活动构成,而每一活动又涉及哪些操作,需要什么生产资料。然后,识别出这些业务操作产生的业务凭证和业务产出,以便于在数据资产平台上高效管理来自众多IT系统的信息。值得注意的是,医院可能拥有上百个IT系统,但并非所有数据都需要纳入平台,因为存储、处理和清洗数据均伴随高昂成本。因此,在构建数据资产时,识别真正具有价值的信息至关重要,确保投资回报率合理,避免资源的无效配置。


在此过程中,我们发现数据要素的模型设计不应受现有IT系统的局限。随着IT技术的进步,各系统对经营活动的记录详略不一。例如,传统的HIS系统设计较为粗放,其数据结构的记录能力有限。若数据要素平台简单复制当前HIS系统设计,未来IT系统升级或更换将导致数据要素平台面临重构风险。因此,数据要素平台设计应超前于现有IT架构,具备前瞻性和灵活性。


此外,根据用户对特定诊疗活动数据的兴趣,我们可以推动IT系统的优化,促使系统更详细、精确且实时地记录相关业务与经济活动。这标志着从以往业务需求驱动IT建设的模式,转向数据价值驱动的新型发展模式。当市场显示对某一类特定数据有高价值需求时,医院可投资升级或新建对应的 IT系统,以更好地服务于数据要素平台,形成数据驱动的正向反馈循环。此过程不仅增强了数据要素平台的功能,也促进了IT系统的持续演进,形成了双向促进的良性机制。


综上所述,随着对数据要素未来定位的认识深化,我们对IT系统、数据仓库乃至整个数据服务体系的视角和规划策略亦需相应调整,这将深刻影响并指导我们后续的信息化建设路径。


我们需要的是构建一个高层次、抽象的概念框架,以便全面涵盖我们医院的各项经营与管理活动。还有另一个至关重要的方面,是实现数据的标准化与归一化。在医疗信息化领域,我们熟知各医院采用各自的诊疗编码体系,然而随着国家推广ICD编码,我们发现不同医院之间的诊疗数据可实现合并分析。


假设未来这些数据不仅在医疗行业内被复用和整合,还能与其他如康养、保险等领域相结合,便会愈加凸显数据标准化与归一化的重要性。否则,当某企业同时购入A医院和B医院的数据时,因编码体系不一致,单纯靠数据清洗难以解决根本问题,数据整合将面临巨大挑战。因此,将数据视为一种核心要素,其规范化、标准化成为我们必须执行的关键步骤。


在医疗信息化领域,特别是在大型医院环境中,我们常面临一项共性挑战:组织编码、组织信息、部门信息及人员信息管理的混乱状态。这一问题根源在于信息的分散与重复。例如,每位员工的信息可能散布于人事管理系统、HIS、教学管理系统、OA等多个平台中。每个系统各自记录着员工的不同侧面信息,如人事档案、系统操作权限、教学活动参与情况等,这些信息往往基于员工的身份证号码或工号进行关联。


实现这些跨系统的数据实时同步与统一管理,我们常常引用之前在阿里的经历,关键在于识别哪些信息是核心的,并确定它们应由哪个IT系统作为主要维护源。举例来说,可能会有十项信息被指定在一个IT系统中作为主数据,而另外十项信息则归属另一个系统的管辖,剩余的信息使用者则只拥有只读权限,无权修改。


进一步探讨,假设别人来购买我们的数据要素,肯定是期望这些数据能够支持其还原业务过程并进行回溯分析,以此增进对医疗机构生产经营活动的深入理解。实际上,购买数据的行为,本质上是希望通过数据分析与挖掘、得到有价值的信息。因此,所涉及的数据必须在确保安全性的前提下,高效地反映我们的经营流程与行为模式,形成在数字空间的数字孪生。


在数字空间中实现这种还原能力至关重要,因为它开启了模拟经营情景、进行仿真实验等多种可能性,进而使我们能够迅速识别并优化经营流程及生产链路。要达到这一目标,要求我们从企业全局视角出发,考虑数据建模、存储方式以及表达形式,确保一切设计都有利于经营过程的精准重现。


刚刚我们提到了医院的原始数据,这些数据内部潜藏着大量更为深层的信息价值。利用人工智能与算法手段,我们可以从这些原始数据中挖掘并提炼出有价值的信息。为此,我们通常采纳一种灵活且强大的工具——标签体系。这一体系能够有效地描述对象上的多元高层信息,是我们在基础设施建设中极为关键的一环。它使为每个对象赋予标签成为可能,并且这些标签和标签之间还可以进行组合再计算。


在此,需要特别强调的是,在数据要素、数据仓库及数据库的设计层面,我们的基本原则始终围绕着真实世界中的“对象”展开,而非单纯基于IT系统中的数据表或数据项。例如,数据资产模型设计应着眼于“患者”这一实体,或是“CT检查”这样的具体医疗行为,而非抽象的数据库表格。偏离这一原则,将难以实现系统的可扩展性,也无法促进不同业务领域间的有效衔接。因此,确保设计根植于现实世界的对象实体,对于构建具备高度适应性和互联性的数据架构至关重要。


数据资产增值的另一个核心在于构建一套科学的指标体系,该体系是对数据多维度属性的汇总、量化与评估。大家都知道医院在做高质量发展,如国考指标、等级医院考核指标等。这些指标实质上是对医疗机构运营状况的具体量化,并通过同比、环比分析揭示其变化规律,进而支持不同机构间的横向对比。


指标体系的本质,在于确立一个统一的标准,用以评判特定对象或行为在特定领域的表现。因此,我们需对指标本身实施标准化与统一化处理,确保评价的客观性和可比较性。在数据资产管理的基础建设阶段,超越传统IT系统的局限,围绕业务实体构建数据资产显得尤为重要。这意味着,数据资产的构建应紧密围绕业务需求展开,需谨慎判断哪些信息能真正体现机构的核心价值。唯有如此,所投入的成本才有望通过数据的价值实现回报。


在探讨基础设施建设之余,我们还需要深入讨论数据要素的管理时效性。数据的产生与过期构成了一个动态过程,对此的有效管理至关重要。核心在于明确数据生命周期中的责任归属:数据的生成者、质量保证方、二次处理负责人,以及指标、标签的定义者与计算执行者。在实践中,我们发现确保数据定义的一致性是一项巨大挑战,尤其是在多部门环境下,即便对于如“门诊人次”这样基本的概念,不同科室的理解和应用也可能存在显著差异。


因此,建立全局一致的数据定义体系是基础中的基础。这要求所有指标无论服务于哪个科室,其命名、目录管理都应遵循全院统一的标准。计算同一指标时,数据来源与计算规则也必须保持一致,这是确保数据质量的根本。如此一来,当数据被应用或出售时,我们能够清晰地解释其背后的逻辑,有效应对可能的质疑。缺乏这一基础,数据平台常面临信任危机,每一次数据准确性的争议都需要耗费大量资源去验证和解释,这对平台的信誉和效率都是重大考验。


故而在构建数据基础设施和平台时,必须系统化地整理数据来源、明确数据定义及计算逻辑,并以统一、清晰的方式展现,便于内外部人员理解与核查。这一过程不仅关乎内部职责的明确划分,也是对外进行数据确权和销售的前提条件。数据确权工作的内部梳理是基石,奠定了一切后续操作的可靠基础。


数据安全是普遍关注的重点议题,但实施过程中制定有效的策略却极具挑战性。首要难题在于如何合理划分数据的安全等级。尽管国家已针对特定类型数据,如患者信息,制定了明确的标准,但在医院内部,数据流通的情况则更为复杂。例如,通过数据分析重现诊疗过程及经济活动时,哪些具体的诊疗活动数据属于敏感范畴,不应被外界所复原,界定其范围成为了一项关键任务。这类需严格保护的信息构成了高等级数据的核心。


因此,识别高等级数据的过程,实质上是对医院数据资产进行深入剖析,明确何为机密、何为可商用的界限。这一过程对于精准划分数据等级至关重要,它要求对每一个数据对象及其组成元素,详细定义其安全级别、处理方式与管控措施。唯有如此,才能构建起坚实的数据安全防线,防止安全事件的发生,因为任何安全疏漏都可能导致运营中断。因此,尽管面临重重困难,跨越数据安全这道门槛,却是医疗机构不可回避的挑战。


数据资产质量评估是数据应用的根本,涉及数据的准确性、一致性、完整性和各数据间的自洽性。实践中发现,从IT系统到数据仓库或数据湖的数据传输过程中,问题频发,超过50%的数据问题根源于此。具体而言,这些问题源于对数据表和数据本身理解的偏差、IT系统数据变更未被及时察觉等。由于IT系统的高频变动性,期望每次变更都能即时通知数据团队既不现实也不可行。因此,核心挑战在于如何使数据体系主动感知IT系统及其数据的变化,从而确保能够迅速识别数据语义的任何变化,并利用技术手段有效提取相关信息且能保障其时效性。特别是针对临床实时AI应用等场景,数据采集需达到秒级响应,同时在处理海量数据时,需依据数据时效性优化资源分配与制定差异化采集策略,避免对IT系统造成不必要的负担。


其次,数据加工逻辑的复杂性亦不容忽视。将原始IT系统数据转化为数据要素平台中的业务对象和流程,不仅要有高度复杂的转换逻辑,还须确保这一过程的透明度与可管理性,以便清晰地监控和解决潜在问题。在此基础上,实现数据要素的高效利用,实际上是对现有数据仓库和数据湖技术的进一步深化与拓展,提出了更高层次的技术挑战。


数据服务的范畴广泛,它服务于医院的经营决策、科研管理、临床实践乃至对外交易等多个维度。尤为重要的是,随着AI技术的兴起,其在数据服务中的支撑作用日益凸显。传统上,业务中台聚焦于业务流程的自动化,而今,如何无缝衔接数据中台与AI大模型,成为构建真正智慧医院的关键。它要求算法模型全面融入医院运营的每一环节,包括但不限于分诊、排班、药品发放及入院管理等,旨在形成一个AI赋能的生产系统,而非简单叠加AI应用。


这对数据平台及原有的HIS、HRP等提出了革新要求。智慧医院的发展愿景是实现智能化应用在医疗体系中无所不在。因此,当前的挑战在于如何实时将高质量的数据输送给AI模型,确保业务中台、数据中台与AI技术的有效联动。我们正积极投身于这一领域的探索,尝试实现业务、数据与AI三者的实时协同,尽管仍处于初步阶段,但我们已窥见未来系统变革的端倪,预见到未来的HIS系统将与当下截然不同,这是一个令人振奋的前景。


最终,我们需构建一个数据要素的总览图,即所谓“大盘”。当前,国家正逐步出台数据资产目录与数据资产管理指南等相关政策,就数据要素对于医疗卫生行业而言,如何超越原始数据的局限,通过优化数据的组织形式,使之易于理解与流通,从而呈现出全新的价值形态。这要求我们在未来持续探索与实践。


本次论坛为我们提供了宝贵的机会,共同探讨数据资产与数据要素资产化。尽管这一进程尚处于初级阶段,但我们已能清晰预见其广阔且颠覆性的未来潜力。

版权声明

本文仅作者转发或者创作,不代表旺旺头条立场。
如有侵权请联系站长删除

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门