在大数据世界中,有两个术语你会听得最多:数据管理和数据治理。这两个术语虽然相互关联,但含义不同,如果您的企业要制定有效的整体数据战略,了解它们之间的区别非常重要。
Tableau 也许对这两个术语之间的区别有最简洁的描述。这家 Salesforce 旗下的商业智能和分析公司在一篇博文中写道:“用最简单的话来说,数据治理是围绕数据制定政策和程序,而数据管理则是制定这些政策和程序,以汇编和使用这些数据进行决策。”
Informatica 对数据管理和数据治理之间的区别也有很好的解释。“数据治理是一套原则、标准和实践。它们适用于数据的端到端生命周期(收集、存储、使用、保护、归档和删除)。这可以确保数据的可靠性和一致性,”这位数据集成领导者在博客中写道。
“数据管理是数据治理的技术实施,”Informatica 继续说。“没有实施的数据管理只是文档。数据管理能够为企业执行和实施政策和流程。”
图片来源:NextGen Invent NextGen Invent
咨询公司 Arthur D. Little 对数据治理和数据管理之间的区别作了进一步说明。该公司在最近的一份报告中写道:数据治理是 “企业处理数据的战略、政策驱动框架”。它 “定义了与数据资产相关的规则、角色和责任”。
数据管理则是 “处理数据的技术和操作方面”,“包括数据收集、存储、集成和安全等流程”。
属于数据治理范畴的活动往往级别较高。团队中的高管和高级成员(包括首席信息官和数据管理员)将参与其中,他们负责制定总体战略、创建标准,并确定将数据治理战略实际付诸实施的其他团队成员的角色。数据管理团队将设定数据质量目标,并为谁能在哪些用例中访问哪些数据设定规则。
属于数据管理范畴的活动是工作人员的日常工作,他们负责执行上述数据治理团队制定的政策和程序。他们将是数据工程师和其他数据专业人员,负责构建和运行 ETL/ELT 数据管道、管理数据目录、执行数据访问策略和管理数据湖/仓库等。
在一些企业中,数据治理部门和数据管理部门之间的分界线清晰明确,而在另一些企业中,分界线可能不够明确和模糊。在规模较小的组织中,同一个人可能同时负责制定政策(数据治理)和实施政策(数据管理),而在一些规模较大的机构中,这种身兼数职的做法实际上可能违反行业规定。
数据治理和数据管理是相辅相成的(来源:Arthur D. Little)
正如 Tableau 所解释的那样,在最好的情况下,这两个学科能够和谐地统一在一起:
“虽然数据管理和数据治理之间有一些相似之处,主要是它们对于组织中如何使用数据的组织和结构都很重要,但它们的关键之处在于它们之间的差异以及如何协同工作,”该公司在其博客中写道。
“打个比方,数据治理是设计和创建新建筑的蓝图,而数据管理则是建造建筑的行为。虽然你可以在没有蓝图(数据治理)的情况下建造大楼,但效率和效果都会大打折扣,数据结构出现故障的可能性也会更大。”
随着大数据的发展如火如荼,了解数据治理与数据管理之间的根本区别非常重要。由于生成式AI的兴起,对大数据的审查程度越来越高,这凸显了许多组织在数据战略和数据实践中长期存在的缺陷。
企业如果能同时做好数据管理和数据治理工作,不仅能更好地利用已经出现的 GenAI 功能,还能更快地利用即将出现的新AI功能。
原文链接:https://www.bigdatawire.com/2025/05/02/big-data-smackdown-data-management-vs-data-governance/