阅读大数据时代给我们带来了很多呈现信息和解决问题的新方式。在过去的几十年里,我们看到传统的大型机计算已经成为我们的IT系统,大数据时代给我们带来了很多呈现信息和解决问题的新方式。在过去的几十年中,我们看到传统的大型机计算已经开始成为一种场景,在这种场景中,我们的IT系统可以聚合大量数据,并使用这些数据为企业或政府目标和其他目的提供关键的见解。
然而,在这个过程中总是有挑战和障碍,其中最大的是大数据孤岛。
如果您对大数据仓库感到困惑,请考虑一个物理仓库:一个装满资源的金属塔,可以安全锁定以防止篡改或未经授权的访问。
这是技术世界里的一个孤岛,虽然有点不一样。
什么是大数据仓库?
在数字世界中,数据的自由流动至关重要。是数据系统的“生命线”——任何架构存在的理由。数据以无限新奇和引人注目的方式“提供给用户”——但这一切都取决于互联。
当这种自由流动的数据因为任何原因受到阻碍时,专业人士称之为“数据孤岛”。
类似地,数据被锁定,不能用于一般用途或一般访问。它存在于某处,却无法到达有用的地方。
回到之前的物理筒仓类比,大多数农场筒仓都有玉米或其他产品作为动物或人类的饲料。但除非你能把它从筒仓搬到全世界,否则没人会吃那些东西——大数据岛问题也是固有的同样原理。解决方案是能够将数据移动到软件基础设施的隔离区域之外,以便可以用于其预期目的。
结构筒仓
就在几年前,我们中的许多人认为大多数大数据孤岛都是结构性的。
这个想法是,编程和设计不足以允许数据的自由流动。企业将大量数据“粘”在更大架构的角落里,需要中间件和特定的解决方案将数据取出并运行到所需的位置。
最近,世界在结构化数据孤岛方面取得了很大进展,但我们也看到,结构化数据孤岛并不是唯一的问题。
请看2016年12月哈佛商业评论文章《打破数据孤岛》。作家Edd Wilder-James将数据仓库的主要类型分为四类:结构、政治、增长和供应商锁定。这是开始讨论孤岛是如何发生的以及可以采取什么措施的好方法。
政治数据岛
数据孤岛如何变得政治化,这对技术行业意味着什么?
我们询问了Friend的联合创始人兼首席技术架构师、挪威出生的互联网操作系统Hogne Titlestad,并将其称为“大技术孤岛急需的替代品”。
“当今计算面临的主要挑战之一是‘大技术’公司正在创造更多的孤岛,”Titlestad说。“从这些大型企业中,我们看到了政治进入软件项目,这意味着世界其他地方的许多困惑现在已经开始影响到技术领域。”
Titlestad表示,该项目将在2019年看到更多此类活动,包括他所说的“新兴软件技术和协作平台的费用,这些费用将通过在其中提供最佳功能和用户体验来挑战大规模技术寡头。”
他说,开源在更频繁地接管IT资源和政治数据孤岛的解决方案中扮演着重要角色——开放数据接口。
“随着互联网一代的成熟,个人必须开始利用在全球范围内运营的机会,并将有技能的人聚集在一起,”Titlestad说。“根据Github、Gitlab、Sourceforge和其他公司提供的这些优秀开源项目的背景目录,新的颠覆性应用程序肯定会在世界各地出现——基于过去几十年的情况.其中一个人可以做的重要事情是继续表达他们对大技术的蔑视,并利用个人数据来追求利润。”
供应商锁定的数据岛
在某些方面,供应商锁定也可以用于“政治”数据岛类别。
“软件供应商是最早知道数据访问权的人之一,他们的策略可能会挫败用户输出数据(包括)到应用程序中的愿望,”威尔德斯-詹姆斯写道这对于软件即服务应用程序来说尤其危险,因为供应商希望将您放在他们的云平台中。供应商还努力创造一个以软件为中心的整体工作职能和职业道路。来自这个世界的任何暗示都可能威胁到经过培训和认证的软件专业人员的生计。“(有些人通过雇佣多人来避免供应商锁定。了解关于云数据管理的10个误区。)
数据增长孤岛
除了这些类型的障碍,你还有一些被威尔德斯-詹姆斯和其他人称为“成长”的岛屿。
“行政协调是整合数据孤岛的关键,”Adobe平台工程副总裁Anjul Bhambhri在1月12日告诉Techo。
pedia进行了讲述,阐述了与业务规划相关的一些问题。“实现数据孤岛整合的最佳方式是首先实现业务成果的执行一致性。在同意业务成果之前解决数据整合的步骤就是把车推到马前。如果业务目标和结果不一致,那么很有可能在创建客户的整体观点时忽略标记,而不是为技术投资产生投资回报率。“处理数据孤岛
通过查看以上类别的数据孤岛,您可以看到如何实际处理每个数据孤岛。公司可以更好地规划增长和可扩展性,确保供应商不会将数据作为人质,从寡头技术的角度开放接口,最后但同样重要的是,设计他们的系统,以便数据不会被卡在角落,或阁楼或地下室。这些是许多工程师和设计团队在尝试面向未来并防止数据孤岛妨碍业务功能时所拥有的行军命令。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!