采用新的非结构化数据管理方法

写道:史蒂文山-应用基础设施和存储技术高级分析师188宝金博网址是多少

企业存储从未容易。业务取决于数据 - 所有事物都在存储中开始和结束 - 但我们一般处理数据的方式,特别是非结构化数据,并没有以与IT行业的其他段相同的速度演变。当然,我们已经使存储大大更快,更高的容量,但我们没有处理因这种增加的性能和密度而导致的储存生长的真正问题;少得多挑战管理数据增长的数据增长,现在正在跨越全球跨越多个混合储存环境。事实是,你无法控制你看不到的东西;因此,越来越多的企业正在支付大量资金来存储一遍又一遍的同一数据的多个副本。或者甚至更糟糕的是,保持多个版本的同一数据,而无需它们之间的任何引用。

多个存储平台之间的这种大规模数据碎片可以是未选中的存储增长的主要来源之一;并添加到这是“保持一切”对数据管理方法的新风险。Privacy-based initiatives like GDPR in the EU and California’s CCPA-2018 require a complete reevaluation of storage policies across many vertical markets to ensure compliance with these new regulations for securing, protecting, delivering, redacting, anonymizing and authenticating the deletion of data containing personally identifiable information (PII) on demand. While this can be a more manageable problem for database information, it’s a far greater challenge for unstructured data such as documents, video and images that make up a growing majority of enterprise data storage. Without some form of identification this data goes “dark” soon after it leaves the direct control of its creator, and initiatives like GDPR don’t make a distinction between structured and unstructured data.

在多个位置维护类似或匹配的数据集可能有很多很好的理由,比如数据保护或提高可用性。真正的挑战在于能够保持对这些数据的基于策略的控制,而不考虑其物理位置,同时使其能够以正确的原因为正确的人使用。文档和媒体(如图像、音频和视频)在总体商业数据中所占的比例越来越大,公司在继续使用这些数据方面拥有既得利益。但与此同时,如果不能妥善管理所有这些数据,可能会产生严重的法律后果,这可能会让公司损失数百万美元。

云永远改变了IT交付模型;通过混合基础设施,业务不再受空间,电力和资本投资的限制。关于工作量和数据放置的决定现在可以基于业务需求,经济,性能和可用性而不是仅其位置的最佳组合;但是,随着这种自由来,无论可能都需要将数据能见度,治理和策略扩展到数据。在这种情况下,多个系统中数据碎片的问题几乎是不可避免的;因此,它真的归功于接受这一目标,作为一个新的挑战,并采用基于对我们的数据的理解而不是它的内容而不是它的新挑战。

大量数据碎片是在云计算之前就存在的问题,但幸运的是,修复这个问题所需的技术已经可用。从非结构化数据的角度来看,我们认为这需要采用一种现代的方法,它可以跨越数据竖井,用于备份、归档、文件共享、测试和开发数据集,以及连接本地、公共云和边缘的对象存储。基于平台的方法可以帮助您可视化数据,无论数据驻留在何处,更重要的是,可以通过减少数据副本数量、管理存储成本、确保数据符合规定并进行适当的备份,帮助您维护更好的控制。我们还认为,一个理想的解决方案是将基于文件的遗留存储与基于元数据的对象存储提供的管理灵活性和可伸缩性无缝地结合在一起。这要求我们在过去处理非结构化数据管理的方式上进行根本性的转变;但是,这一变化提供了更大的数据可用性和存储级自动化的好处,并为控制和保护业务数据提供了一组新的选项,如果处理不当,业务数据既是主要的业务资产,也是潜在的负债。
3835次点击

使用企业数据义卖创建价值

主导研究员:Katy Ring,研究总监 - IT服务188bet金博宝是什么

在45188宝金博网址是多少1次研究中,我们相信“企业数据集市”可以帮助组织通过使用数据来告知其业务的方向和发展更为灵活。短语'企业数据Bazaar'是用于定义许多人可以访问和利用该信息来构建数据驱动产品的环境的术语。

为了实现这一点,企业需要统一的数据管理层,以便数据科学家和主题专家可以决定如何处理存储的数据。这些层可以使用数据集或数据湖来提供价值,而无需将信息储存在组织内部。然而,许多组织最终陷入了所谓的“数据沼泽”——一个包含大量原始数据的单一环境,而这些数据无法用于任何目的,更不用说多种用途了。通过构建数据治理和自助数据准备功能,将安全性置于这种方法的基础之上,创建具有这些管理层的数据集市可以打破混乱。

与我们的客户有关数据湖泊的客户时,许多人认为他们没有完全理解与他们建造的内容相关的风险。由于每个来源系统具有差异治理和安全策略,因此公司努力审核他们的湖泊作为合规措施的一部分。这场斗争是由数据湖的自助式性质引起的,其中数据可以访问几乎任何目的,使其不清楚是公司将PII数据受到保护,作为GDPR等法规的一部分。

当公司在这种情况下,供应商和服务提供商正在为主要数据官(CDO)开辟内部角色,这些官员可以帮助将业务恢复到轨道上。在一起,这个小组可以为情况造成一个​​补救措施。一个解决方案是建立一个“沙箱”环境,其中包括具有“公民数据集成器”工具的公司范围的策略,控件和元数据管理,该工具允许用户回馈或开发它们如何使用数据的分析。通过这种类型的工具,用户仍然可以以自我服务方式访问数据,并允许在其作为数据产品的生产之前通过IT组或CDO来监督。

除了这种自助服务的“沙箱”数据准备层之外,IT服务提供商还可以帮助有数据治理和数据供应链的公司。这些提供者协助采购,管理和丰富数据,并出售托管服务以进行监管数据消耗。188bet金博宝是什么例如,在审计中,组织需要了解他们持有的数据,谁使用它以及何时何种。该规定为开发企业数据集市提供了强大的机会。

此外,自助服务分析和治理层需要以正确的方式归档,以便随着时间的推移实现一系列用例,而且这通常不是开发单一用例项目的结果。因此,CDO的作用非常重要:这个人是有权获取关于捕获,管理和分享数据的公司范围策略协议的内部冠军。

451 research的IT服务研究总监凯蒂·Ring在她关于企业数188bet金博宝是什么据集市的技术和业务影响报188宝金博网址是多少告中分析了企业数据集市的好处、技术、服务提供商和策略。了解有关此报告的更多信息。
2152的点击率

评估数据科学对分析景观的影响

数据科学的演变 - 包括机器学习,深度学习和其他形式的人工智能 - 对近年来的数据分析景观产生了重大影响,并且看起来在未来几年推动市场的大量变化。

在回应中,451研究的新188宝金博网址是多少数据管理和分析市场地图2018包括对我们的分析市场地图进行完整的重新分类,以反映当今分析用户和用例的现实,将分析市场划分为四个关键领域:
  • 分析工具
  • 分析平台
  • 数据科学工具
  • 数据科学平台
During this webinar, 451 Research’s Research Director, Data Platforms and Analytics, Matt Aslett, will explain the rationale and definitions behind the new categorization, as well as identifying the key challenges and innovations that will shape the analytics and data science market, and also revenue and growth expectations.

网络研讨会还将触及在2018年数据管理和分析市场地图提供的附注的其他方面,包括:
  • 公司绩效管理的演进
  • 向数据管理市场地图添加数据科学管理
3711击中