传统的集中数据体系结构在现代需求的重量下紧张。随着组织的增长,他们的数据需求以及瓶颈也是如此。输入数据网格:一种开创性的方法,正在重新定义企业对数据架构和所有权的看法。
数据网格通过将数据视为产品并分配面向域的团队来管理,服务和创新的责任通过将数据分散在其核心。与传统的数据湖泊或仓库不同,中央数据团队控制着一切,数据网格赋予了个人业务部门的能力,即交易,财务,运营 - 负责他们的数据。
为什么这很重要?
因为集中模型难以扩展。随着组织收集更多数据,中央团队会被请求淹没,通常会延迟见解并放缓创新。相比之下,数据网格可以实现可扩展,敏捷和特定于域的数据操作,从而显着改善了映射的时间。
根据该概念的原始建筑师扎哈克·德格尼(Zhamak Dehghani)的说法,数据网的四个支柱
- 面向域的数据所有权
- 数据作为产品
- 自助数据基础架构
- 联邦计算治理
这些原则不仅可以启用自主权,还可以促进问责制和数据质量。每个域团队都负责其数据产品的生命周期,包括可发现性,安全性和可靠性。这意味着更高质量的数据集,而降低了对中央IT负担过重的依赖。
收养已经在进行中。 Netflix,JPMorgan Chase和Intuit是探索或实施数据网格以打破孤岛和加速分析的公司。借助Snowflake,Databricks和DBT等云原生工具,建筑物特定的数据产品从未如此可行。
底线?
如果您的组织正在努力扩展数据操作,则通过数据网格将数据拥有权分散的可能性可能是您的下一个竞争优势。这不仅是技术转变,而且是一种文化上的转变。而且它刚刚开始。