采用新的非结构化数据管理方法

写道:史蒂文山- 高级分析师,应用基础设施和存储技术 - 451研究www.yabo11vip.com

企业存储从未容易。业务取决于数据 - 所有事物都在存储中开始和结束 - 但我们一般处理数据的方式,特别是非结构化数据,并没有以与IT行业的其他段相同的速度演变。当然,我们已经使存储大大更快,更高的容量,但我们没有处理因这种增加的性能和密度而导致的储存生长的真正问题;少得多挑战管理数据增长的数据增长,现在正在跨越全球跨越多个混合储存环境。事实是,你无法控制你看不到的东西;因此,越来越多的企业正在支付大量资金来存储一遍又一遍的同一数据的多个副本。或者甚至更糟糕的是,保持多个版本的同一数据,而无需它们之间的任何引用。

多个存储平台之间的这种大规模数据碎片可以是未选中的存储增长的主要来源之一;并添加到这是“保持一切”对数据管理方法的新风险。Privacy-based initiatives like GDPR in the EU and California’s CCPA-2018 require a complete reevaluation of storage policies across many vertical markets to ensure compliance with these new regulations for securing, protecting, delivering, redacting, anonymizing and authenticating the deletion of data containing personally identifiable information (PII) on demand. While this can be a more manageable problem for database information, it’s a far greater challenge for unstructured data such as documents, video and images that make up a growing majority of enterprise data storage. Without some form of identification this data goes “dark” soon after it leaves the direct control of its creator, and initiatives like GDPR don’t make a distinction between structured and unstructured data.

在多个位置维护类似或匹配的数据集,例如数据保护或增加可用性,可能存在许多完全有利的原因。真正的挑战在于能够维护基于政策的控制数据,无论物理位置如何,同时都可以以正确的原因对合适的人员提供。图像,音频和视频等文件和媒体正在弥补整体业务数据的百分比,而公司对继续使用该数据具有既得利益。但与此同时,可能有严重的法律后果,无法正常管理所有这些数据,可能会耗费公司数百万美元。

云永远改变了IT交付模型;通过混合基础设施,业务不再受空间,电力和资本投资的限制。关于工作量和数据放置的决定现在可以基于业务需求,经济,性能和可用性而不是仅其位置的最佳组合;但是,随着这种自由来,无论可能都需要将数据能见度,治理和策略扩展到数据。在这种情况下,多个系统中数据碎片的问题几乎是不可避免的;因此,它真的归功于接受这一目标,作为一个新的挑战,并采用基于对我们的数据的理解而不是它的内容而不是它的新挑战。

群众数据碎片是云前存在的问题,但幸运的是要解决此问题所需的技术已经可用。从非结构化数据的角度来看,我们认为这涉及拥抱现代方法,可以跨越数据孤岛,用于备份,存档,文件共享,测试数据集和对象存储在本地,公共云和边缘的桥梁上的对象存储。基于平台的方法可以帮助您在数据驻留到数据中的可见性,更重要的是,可以通过减少数据副本数量,管理存储成本和确保您的数据保持符合性,帮助您保持更大的控制。正确备份。我们还认为一个理想的解决方案无缝融合遗留,基于文件的存储,并通过基于元数据的对象存储提供的管理灵活性和可伸缩性。这需要我们在过去涉及非结构化数据管理的方式中的根本转变;但它是一种更改,提供了更大的数据可用性和存储级别自动化的好处,并提供了一种用于控制和保护业务数据的新选项,该商业数据如果没有正确处理,这是一个主要的商业资产和潜在责任。
3834次点击

使用企业数据义卖创建价值

主导研究员:Katy Ring,研究总监 - IT服务yabo07

在45www.yabo11vip.com1次研究中,我们相信“企业数据集市”可以帮助组织通过使用数据来告知其业务的方向和发展更为灵活。短语'企业数据Bazaar'是用于定义许多人可以访问和利用该信息来构建数据驱动产品的环境的术语。

为实现这一目标,企业需要统一的数据管理层,使数据科学家和主题专家可以决定如何处理存储的数据。这些层使得可以使用数据集 - 或数据湖 - 在组织内没有围类信息的情况提供价值。然而,许多组织已经最终结束了可以将其描述为“数据沼泽” - 一个房屋外部环境的单个环境,其大量的原始数据无法容易地访问任何目的,更不用说多次使用。使用这些管理层创建数据集市将通过构建数据治理和自助服务数据准备功能,在这种方法的基础上将安全性分解沼泽。

与我们的客户有关数据湖泊的客户时,许多人认为他们没有完全理解与他们建造的内容相关的风险。由于每个来源系统具有差异治理和安全策略,因此公司努力审核他们的湖泊作为合规措施的一部分。这场斗争是由数据湖的自助式性质引起的,其中数据可以访问几乎任何目的,使其不清楚是公司将PII数据受到保护,作为GDPR等法规的一部分。

当公司在这种情况下,供应商和服务提供商正在为主要数据官(CDO)开辟内部角色,这些官员可以帮助将业务恢复到轨道上。在一起,这个小组可以为情况造成一个​​补救措施。一个解决方案是建立一个“沙箱”环境,其中包括具有“公民数据集成器”工具的公司范围的策略,控件和元数据管理,该工具允许用户回馈或开发它们如何使用数据的分析。通过这种类型的工具,用户仍然可以以自我服务方式访问数据,并允许在其作为数据产品的生产之前通过IT组或CDO来监督。

除了这种自助服务的“沙箱”数据准备层之外,IT服务提供商还可以帮助有数据治理和数据供应链的公司。这些提供者协助采购,管理和丰富数据,并出售托管服务以进行监管数据消耗。yabo07例如,在审计中,组织需要了解他们持有的数据,谁使用它以及何时何种。该规定为开发企业数据集市提供了强大的机会。

此外,自助服务分析和治理层需要以正确的方式归档,以便随着时间的推移实现一系列用例,而且这通常不是开发单一用例项目的结果。因此,CDO的作用非常重要:这个人是有权获取关于捕获,管理和分享数据的公司范围策略协议的内部冠军。

IT Services的研究总监Katy Ring检查了企业数据集市,yabo07技术,服务提供商和策略的www.yabo11vip.com好处,用于使他们在企业数据集市的技术和业务影响报告中。了解有关此报告的更多信息。
2152击中

评估数据科学对分析景观的影响

数据科学的演变 - 包括机器学习,深度学习和其他形式的人工智能 - 对近年来的数据分析景观产生了重大影响,并且看起来在未来几年推动市场的大量变化。

在回应中,451研究的新www.yabo11vip.com数据管理和分析市场地图2018包括对我们的分析市场地图的完整重新分类,以反映当今分析用户和用例的现实,将分析市场分为四个关键部门:
  • 分析工具
  • 分析平台
  • 数据科学工具
  • 数据科学平台
During this webinar, 451 Research’s Research Director, Data Platforms and Analytics, Matt Aslett, will explain the rationale and definitions behind the new categorization, as well as identifying the key challenges and innovations that will shape the analytics and data science market, and also revenue and growth expectations.

网络研讨会还将触及在2018年数据管理和分析市场地图提供的附注的其他方面,包括:
  • 企业绩效管理的持续发展
  • 向数据管理市场地图添加数据科学管理
3710次点击