EBpay钱包官网

睿治

智能数据治理平台

睿治作为国内功能最全的数据治理产品之一,入选IDC企业数据治理实施部署指南。同时,在IDC发布的《中国数据治理市场份额》报告中,陆续在四年蝉联数据治理解决方案市场份额第一。

在线免费试用 DEMO体验 视频介绍

数据本体与数据管理的关系浅谈

时间:2026-01-26来源:数据工匠俱乐部浏览数:162

引言

“本体”这个源于哲学领域的词汇,终于在信息科学领域里引发了一场新的思考(炒作)和创新(机会)。本体能被计算机所识别、模拟和处理,就必须经过“数据本体”这个中间概念。作为一名数据管理人员,初听“数据本体”这个词感觉很抽象,看它的定义却又有“老酒装新瓶”之嫌,不就是数据管理里的元数据、数据架构、数据标准这几方面工作的整合吗?换个角度不就是主数据管理的扩展升级版吗?

本着事物都是螺旋上升,历史总是曲折前进这一基本原理,结合近一年人工智能技术的快速跃变,笔者认真对比和思考了数据本体与当下主流数据管理的范围和关系,认识到数据本体确实为数据管理这坛老酒带来了新的意义和任务,两者上下承接,相互成就,最终目标是使人工智能可以脱离人工干预,成为真正自主的智能。


概念辨析

1.数据本体

数据本体源于哲学概念“本体”(Ontology),在信息科学中被定义为"对领域概念体系的规范化描述",是对数据领域内概念、概念属性、概念间关系的规范化、形式化描述,强调数据的语义一致性、可理解性、可复用性和互操作性。

可以认为数据本体回答了“数据”的哲学三问:我是谁?我从哪里来?我到哪里去?从而使语义离散的数据聚合为了数据本体,就具备了一定意义上的能动性和智能决策的基础。

我是谁:数据的业务含义、语义、属性、规则;

我从哪里来:语境、上下关系、数据之间的语义关联,概念间的逻辑联系,

我到哪里去:实现机器对数据语义(含义)的理解和自动推理,实现语义搜索、知识图谱构建、自动决策等。


2.数据管理三个基础要素

上述数据本体的哲学三问,很容易与数据管理中的三个数据资源的管理工具和要素关联起来,即:元数据、数据标准、数据架构,本文内暂称它们为数据管理三要素。

数据架构

元数据

数据标准

定义

一套规则、政策、标准和模型,用于管理和定义数据类型,以及如何在组织和信息中使用、存储、管理和集成数据。

“关于数据的数据”。描述数据的基本含义、内容、结构、管理信息等。

为保障数据一致性和质量而制定的规范性文件,规定了数据如何被定义、命名、格式化和使用。

目标

是企业战略、企业架构、业务架构在数据治理层面的映射。

帮助人(和数据系统)查找、理解、管理和使用数据。

实现数据的统一规范,便于交换和集成。

主要内容

数据目录

数据模型

数据规则

数据分布与流向

业务元数据

技术元数据

管理元数据

对象类数据标准(数据元标准、主数据标准、指标数据标准);

基础类数据标准


3.数据本体与数据管理三要素

基于数据本体和数据管理中三个基础要素的概念解析,我们进一步对比两者的不同。数据本体不是现有数据管理的优化和简单升级,也不是元数据、数据架构、数据标准的简单相加,而是伴随智能技术质变的一种管理思路和方式的跃迁,面向的目标是最终实现机器或系统的自主决策和行为。

数据本体

数据管理三要素

管理方式

基于语义的智能化管理

基于工具的流程化管理

管理目标

提高数据的机器可读性,实现数据的语义智能管理。

实现数据可用性,优化数据资源的物理管理过程。

主要任务

消除语义断层,构建智能知识图谱,实现本体的自动化、自主化运行。

打破信息孤岛,进行数据规则统一和融合,支撑上层应用,方便人类进行决策和行为。


4.主数据与数据本体

数据本体与主数据两者虽不是同一层级和颗粒度的概念,但两者也有一些重叠和易混淆之处,有必要梳理一下,以便更好地理解数据本体的内涵,明晰两者的关系,在实践过程中更容易实行衔接与升级。

主数据是描述组织核心业务实体(事务对象)关键的、共享的、统一的、相对稳定的数据,是组织的核心业务实体(如客户、产品、供应商、员工)的唯一、准确、权威的数据源。

数据本体

主数据

抽象程度

高度抽象的逻辑模型,聚焦“是什么、有什么关系”,不涉及具体数据值

具象的业务数据,聚焦“具体是什么值”,是对本体概念的实例化

覆盖范围

覆盖范围更宽泛,可涵盖企业全域数据的概念体系,包括主数据、交易数据、参考数据等所有数据类型的语义定义

覆盖范围更聚焦,仅针对核心业务实体,不包含交易数据(如订单流水)、临时数据等

价值定位

“赋能数据的语义化和智能化”,是实现数据知识化,进而业务智能化,达到自动化决策和行动。

“保障核心数据的一致性和共享性”,是实现业务流程协同的基础。


数据本体与数据管理的联系

1.数据本体对数据管理三要素的"升维整合"

数据本体不是元数据、主数据、数据标准的简单组合拳,而是“增强升级、升维整合”,它从更高维度解决了传统数据管理流程难以解决的“语义鸿沟”问题。数据本体给予“语义依据”—— 没有本体的统领,数据管理的各环节很容易变成“各自为战”,出现“貌合神离”的治理痛点。

对于数据架构:数据本体给予语义层的关系网络,而非简单的实体间的有向图,如:客户与订单关系,从原来的关联变为“提交”,给实体间的连线赋予了具体的业务含义和动作。

对于元数据:数据本体将元数据转化为可推理的知识单元,将对数据的描述升级为对实体的业务属性和规则的全面透视扫描,不同组织的数据本体进行对接时,即使字段名称、规则不同,也可根据字段语义自动进行匹配。如:一个系统中是姓名字段,另一系统是姓和名两个字段,则两个系统数据对接时,可自动匹配,而不需要转换。

对于数据标准:数据本体实现标准的动态语义校验,如:检测采购单中的商品、型号、规格和兼容性是否满足物料需求,价格与数量是否满足成本要求,是否满足优惠条件等。


2.数据管理对数据本体的"基础支撑"

数据本体的构建不是从零开始,也不是凭空搭建,而是基于已有数据管理的基础。如果组织已具备了较成熟和较优质的数据管理基础,数据架构、元数据、数据标准的管理信息都是比较完整、真实、准确的,那么构建数据本体的基础框架、基础结点信息、实体范围、语义边界就基本具备了。


面向数据本体的数据管理进阶

基于良好的数据管理基础,构建数据本体的管理,具体到数据架构、元数据、数据标准这三方面,还要做全面的升级和扩展。升级的核心逻辑是:以数据本体的“语义、规则、关联”为导向,重构三个要素的管理目标、方式和工具。

1.数据架构管理:从“技术架构”到“语义架构”

传统数据架构多聚焦存储架构、系统架构等技术设计,缺乏对数据语义的统筹。数据本体的架构需要完成数据语义的整合。

升级要求:以数据本体为实体,实现“语义驱动架构设计”,特别是对概念级数据架构进行升级或重构,定义组织全域数据的本体概念、业务区域和关系,作为架构设计的顶层设计。构建本体语义和行为导向的数据分层与流转架构;关注语义的一致性而非简单书面的一致性;顺利获得模块化、虚拟技术等方式增加架构的弹性扩展能力。


2.元数据管理:从“被动记录”到“主动赋义”

元数据是描述数据的数据。传统元数据管理做的是:数据是什么,元数据就记录成什么,且多为技术元数据采集,缺乏对业务语义的关联映射。

升级要求:拓展元数据覆盖范围,对齐本体概念的各维度,补全业务元数据(如业务术语、指标口径、业务规则),或增设语义元数据(如数据与本体概念的映射关系、概念间的语义关联),形成“管理-技术-业务-语义”四位一体的元数据体系。建立元数据到本体概念的映射规则库,顺利获得自动匹配+人工校准进行同步,本体发生变更时,触发联动更新,确保映射关系的时效性:基于自然语言处理(NLP)等技术,进行语义定义和标签;强化关联分析能力,增强本体关系的血缘分析、影响分析功能,挖掘数据间的隐性关联,补充数据本体的关系定义。


3.数据标准管理:从“规则固化”到“规则自适应”

传统数据标准多聚焦格式、编码、命名规范等技术规范,缺乏与业务语义的绑定,业务逻辑规则不足甚至缺失。

升级要求:以数据本体为单元,重构数据标准的层级体系,基于数据本体的概念层级制定数据本体的行为标准,建立行动层、语义层、技术层的不同层面的规则与标准,并随数据本体和业务逻辑的变化而动态调整。建立“本体-标准-本体”的标准制定与校验互证机制,构建自动化校验链路;将数据标准规则嵌入数据本体模型,有助于数据标准的动态迭代,适配本体的演进。


总结

数据向数据本体转变的过程就像从“被动的有机算料”进化为“自驱的智能生物”的过程。数据管理也需要完成相应的向“数据本体管理”的转换。数据架构管理构建数据本体为单元的全域数据本体的多维地图;元数据管理完成数据本体的语义构建;数据标准管理负责数据本体的语义一致性和行为规则的构建。三者协同改进,满足数据本体管理的新目标和新任务。

(部分内容来源网络,如有侵权请联系删除)
立即申请数据分析/数据治理产品免费试用 我要试用
customer

在线咨询

在线咨询

点击进入在线咨询

联系客服

扫描下方二维码,添加客服

亿信微信二维码

扫码添加好友,获取专业咨询服务