- 产品
- 产品解决方案
- 行业解决方案
- 案例
- 数据资产入表
- 赋能中心
- 伙伴
- 关于
时间:2026-01-26来源:数据工匠俱乐部浏览数:162次
“本体”这个源于哲学领域的词汇,终于在信息科学领域里引发了一场新的思考(炒作)和创新(机会)。本体能被计算机所识别、模拟和处理,就必须经过“数据本体”这个中间概念。作为一名数据管理人员,初听“数据本体”这个词感觉很抽象,看它的定义却又有“老酒装新瓶”之嫌,不就是数据管理里的元数据、数据架构、数据标准这几方面工作的整合吗?换个角度不就是主数据管理的扩展升级版吗?
本着事物都是螺旋上升,历史总是曲折前进这一基本原理,结合近一年人工智能技术的快速跃变,笔者认真对比和思考了数据本体与当下主流数据管理的范围和关系,认识到数据本体确实为数据管理这坛老酒带来了新的意义和任务,两者上下承接,相互成就,最终目标是使人工智能可以脱离人工干预,成为真正自主的智能。
一概念辨析
1.数据本体
数据本体源于哲学概念“本体”(Ontology),在信息科学中被定义为"对领域概念体系的规范化描述",是对数据领域内概念、概念属性、概念间关系的规范化、形式化描述,强调数据的语义一致性、可理解性、可复用性和互操作性。
可以认为数据本体回答了“数据”的哲学三问:我是谁?我从哪里来?我到哪里去?从而使语义离散的数据聚合为了数据本体,就具备了一定意义上的能动性和智能决策的基础。
我是谁:数据的业务含义、语义、属性、规则;
我从哪里来:语境、上下关系、数据之间的语义关联,概念间的逻辑联系,
我到哪里去:实现机器对数据语义(含义)的理解和自动推理,实现语义搜索、知识图谱构建、自动决策等。
2.数据管理三个基础要素
上述数据本体的哲学三问,很容易与数据管理中的三个数据资源的管理工具和要素关联起来,即:元数据、数据标准、数据架构,本文内暂称它们为数据管理三要素。
|
数据架构 |
元数据 |
数据标准 |
|
|
定义 |
一套规则、政策、标准和模型,用于管理和定义数据类型,以及如何在组织和信息中使用、存储、管理和集成数据。 |
“关于数据的数据”。描述数据的基本含义、内容、结构、管理信息等。 |
为保障数据一致性和质量而制定的规范性文件,规定了数据如何被定义、命名、格式化和使用。 |
|
目标 |
是企业战略、企业架构、业务架构在数据治理层面的映射。 |
帮助人(和数据系统)查找、理解、管理和使用数据。 |
实现数据的统一规范,便于交换和集成。 |
|
主要内容 |
数据目录 数据模型 数据规则 数据分布与流向 |
业务元数据 技术元数据 管理元数据 |
对象类数据标准(数据元标准、主数据标准、指标数据标准); 基础类数据标准 |
3.数据本体与数据管理三要素
基于数据本体和数据管理中三个基础要素的概念解析,我们进一步对比两者的不同。数据本体不是现有数据管理的优化和简单升级,也不是元数据、数据架构、数据标准的简单相加,而是伴随智能技术质变的一种管理思路和方式的跃迁,面向的目标是最终实现机器或系统的自主决策和行为。
|
数据本体 |
数据管理三要素 |
|
|
管理方式 |
基于语义的智能化管理 |
基于工具的流程化管理 |
|
管理目标 |
提高数据的机器可读性,实现数据的语义智能管理。 |
实现数据可用性,优化数据资源的物理管理过程。 |
|
主要任务 |
消除语义断层,构建智能知识图谱,实现本体的自动化、自主化运行。 |
打破信息孤岛,进行数据规则统一和融合,支撑上层应用,方便人类进行决策和行为。 |
4.主数据与数据本体
数据本体与主数据两者虽不是同一层级和颗粒度的概念,但两者也有一些重叠和易混淆之处,有必要梳理一下,以便更好地理解数据本体的内涵,明晰两者的关系,在实践过程中更容易实行衔接与升级。
主数据是描述组织核心业务实体(事务对象)关键的、共享的、统一的、相对稳定的数据,是组织的核心业务实体(如客户、产品、供应商、员工)的唯一、准确、权威的数据源。
|
数据本体 |
主数据 |
|
|
抽象程度 |
高度抽象的逻辑模型,聚焦“是什么、有什么关系”,不涉及具体数据值 |
具象的业务数据,聚焦“具体是什么值”,是对本体概念的实例化 |
|
覆盖范围 |
覆盖范围更宽泛,可涵盖企业全域数据的概念体系,包括主数据、交易数据、参考数据等所有数据类型的语义定义 |
覆盖范围更聚焦,仅针对核心业务实体,不包含交易数据(如订单流水)、临时数据等 |
|
价值定位 |
“赋能数据的语义化和智能化”,是实现数据知识化,进而业务智能化,达到自动化决策和行动。 |
“保障核心数据的一致性和共享性”,是实现业务流程协同的基础。 |
二数据本体与数据管理的联系
1.数据本体对数据管理三要素的"升维整合"
数据本体不是元数据、主数据、数据标准的简单组合拳,而是“增强升级、升维整合”,它从更高维度解决了传统数据管理流程难以解决的“语义鸿沟”问题。数据本体给予“语义依据”—— 没有本体的统领,数据管理的各环节很容易变成“各自为战”,出现“貌合神离”的治理痛点。
对于数据架构:数据本体给予语义层的关系网络,而非简单的实体间的有向图,如:客户与订单关系,从原来的关联变为“提交”,给实体间的连线赋予了具体的业务含义和动作。
对于元数据:数据本体将元数据转化为可推理的知识单元,将对数据的描述升级为对实体的业务属性和规则的全面透视扫描,不同组织的数据本体进行对接时,即使字段名称、规则不同,也可根据字段语义自动进行匹配。如:一个系统中是姓名字段,另一系统是姓和名两个字段,则两个系统数据对接时,可自动匹配,而不需要转换。
对于数据标准:数据本体实现标准的动态语义校验,如:检测采购单中的商品、型号、规格和兼容性是否满足物料需求,价格与数量是否满足成本要求,是否满足优惠条件等。
2.数据管理对数据本体的"基础支撑"
数据本体的构建不是从零开始,也不是凭空搭建,而是基于已有数据管理的基础。如果组织已具备了较成熟和较优质的数据管理基础,数据架构、元数据、数据标准的管理信息都是比较完整、真实、准确的,那么构建数据本体的基础框架、基础结点信息、实体范围、语义边界就基本具备了。
三面向数据本体的数据管理进阶
基于良好的数据管理基础,构建数据本体的管理,具体到数据架构、元数据、数据标准这三方面,还要做全面的升级和扩展。升级的核心逻辑是:以数据本体的“语义、规则、关联”为导向,重构三个要素的管理目标、方式和工具。

1.数据架构管理:从“技术架构”到“语义架构”
传统数据架构多聚焦存储架构、系统架构等技术设计,缺乏对数据语义的统筹。数据本体的架构需要完成数据语义的整合。
升级要求:以数据本体为实体,实现“语义驱动架构设计”,特别是对概念级数据架构进行升级或重构,定义组织全域数据的本体概念、业务区域和关系,作为架构设计的顶层设计。构建本体语义和行为导向的数据分层与流转架构;关注语义的一致性而非简单书面的一致性;顺利获得模块化、虚拟技术等方式增加架构的弹性扩展能力。
2.元数据管理:从“被动记录”到“主动赋义”
元数据是描述数据的数据。传统元数据管理做的是:数据是什么,元数据就记录成什么,且多为技术元数据采集,缺乏对业务语义的关联映射。
升级要求:拓展元数据覆盖范围,对齐本体概念的各维度,补全业务元数据(如业务术语、指标口径、业务规则),或增设语义元数据(如数据与本体概念的映射关系、概念间的语义关联),形成“管理-技术-业务-语义”四位一体的元数据体系。建立元数据到本体概念的映射规则库,顺利获得自动匹配+人工校准进行同步,本体发生变更时,触发联动更新,确保映射关系的时效性:基于自然语言处理(NLP)等技术,进行语义定义和标签;强化关联分析能力,增强本体关系的血缘分析、影响分析功能,挖掘数据间的隐性关联,补充数据本体的关系定义。
3.数据标准管理:从“规则固化”到“规则自适应”
传统数据标准多聚焦格式、编码、命名规范等技术规范,缺乏与业务语义的绑定,业务逻辑规则不足甚至缺失。
升级要求:以数据本体为单元,重构数据标准的层级体系,基于数据本体的概念层级制定数据本体的行为标准,建立行动层、语义层、技术层的不同层面的规则与标准,并随数据本体和业务逻辑的变化而动态调整。建立“本体-标准-本体”的标准制定与校验互证机制,构建自动化校验链路;将数据标准规则嵌入数据本体模型,有助于数据标准的动态迭代,适配本体的演进。
四总结
数据向数据本体转变的过程就像从“被动的有机算料”进化为“自驱的智能生物”的过程。数据管理也需要完成相应的向“数据本体管理”的转换。数据架构管理构建数据本体为单元的全域数据本体的多维地图;元数据管理完成数据本体的语义构建;数据标准管理负责数据本体的语义一致性和行为规则的构建。三者协同改进,满足数据本体管理的新目标和新任务。
上一篇:AI与可信数据空间的关系...
在线咨询
点击进入在线咨询
扫描下方二维码,添加客服
扫码添加好友,获取专业咨询服务