释放海量非结构化数据潜能,爱数AnyShare Family 7技术探索之旅揭秘
2020-07-06 15:44:59   来源:互联网
内容摘要
在人类的文明史中,我们总是在追寻以先进的生产力代替落后的生产力。海量非结构化数据正在汹涌而来如今,非结构化数据已占据数据总量的90%,且保持高速增长;非结构化数据存在于各种设备以及各种系统之中,无处不在。毋庸置疑,海量非结构化数据的时代已经到来,海量非结构化数据的管理、处理、保护等巨大挑战与难题也接…

在人类的文明史中,我们总是在追寻以先进的生产力代替落后的生产力。

海量非结构化数据正在汹涌而来

如今,非结构化数据已占据数据总量的90%,且保持高速增长;非结构化数据存在于各种设备以及各种系统之中,无处不在。毋庸置疑,海量非结构化数据的时代已经到来,海量非结构化数据的管理、处理、保护等巨大挑战与难题也接踵而至。

今日,爱数正式揭秘AnyShare Family 7 智能内容云:整合、管理、洞察非结构化数据的生产力平台,为海量非结构化数据而生!

图片1.jpg

爱数总裁贺鸿富介绍 AnyShare Family 7

以智取胜,数以亿计的图片自动分类与搜索

多媒体数据量越来越高,一些大型企业组织中仅图片就有数千万张。而在高速公路系统中,每天就会新增2000万张图片,保存60天的图片量将达到惊人的12亿张。该如何从如此庞大的海量图片库中快速、精准查找到需要的图片?

显然,海量非结构化数据需要强大的搜索引擎。

AnyShare Family 7 智能搜索,能够提供高性能、高扩展性的内容分析及检索服务,可以进行全文检索、精准搜索(包括标签搜索、摘要搜索、编目搜索)、以文搜图、以图搜图,并且与 AnyShare Family 6相比,建立索引速度提升5倍以上,让用户从海量非结构化数据中,迅速获得需要的信息。

通过微服务+索引集群、IVFFLAT倒排索引、支撑集+PQ编码优化,这3大关键技术,AnyShare Family 7 能够以更强的计算能力、更少的内存、更小的查找计算请求,实现图片自动分类与搜索,从容应对海量多媒体数据搜索的挑战。

图片2.jpg


慢就免费,打破海量小文件备份与恢复性能瓶颈

在大型企业中,每50TB的非结构化数据就会带来超过1000万个文件数,平均每个文件的大小仅为几兆,可见海量非结构化数据带来的是海量小文件。而海量小文件的备份与恢复,一直是业界的阿克琉斯之踵:以目前领域内领先的厂商性能为例,平均大小为1MB的文件,总量100TB的数据,备份完成需要14天左右,恢复完成需要18天左右。

AnyShare Family 7 突破了困扰行业数年的技术瓶颈,使平均大小为1MB的文件,总量100TB的数据,备份及恢复完成仅需要5天左右,性能达到全球领先。更为重要的是,AnyShare在海量小文件备份及恢复过程中保持了稳定的高性能。

图片3.jpg

AnyShare Family 7 采用 OSS 网关技术,并结合 AnyBackup Family 7 的高性能备份恢复技术,联袂打造高性能备份恢复方案,相比传统的NAS、对象存储备份恢复技术,性能得到数十倍的提升。

同时,爱数在揭秘会上宣布了一个重要的计划——高性能备份恢复保证计划,用实际行动承诺高性能,用技术创新保障数字资产安全。

图片4.jpg

爱数发布高性能恢复保证计划

弹性适配,革新的现代化体系架构

在数字化时代,面对海量非结构化数据带来的内容管理挑战,需要革新的体系架构。AnyShare Family 7专门为海量数据、海量用户、数字化体验精心设计了现代化体系架构:

1. 独创的多文档域管理,多套文档体系统一管理;

2. 内容数据湖,提供存储、编目、标签、摘要、检索能力,提供强大的数据分析能力;

3. 云原生架构,具备灵活的多云、混合云部署能力,实现系统架构弹性扩展,从容应对海量用户并发访问,高吞吐量的访问请求;

4. 内容总线架构,通过内容集成开放框架,集成各种内容服务,降低系统集成复杂度,实现各种内容应用场景的融合;

5. 全终端一致体验,确保不同办公位置,多终端设备上,获得最佳用户体验。

与OpenText、SharePoint、FileNet、BOX等国外主流的企业管理平台对比,AnyShare Family 7的架构拥有多项创新之处:

1. 数据湖架构,具备海量数据存储及处理能力;

2. 内置人工智能引擎,更具弹性和适应性;

3.内容服务集成架构,更具有开放性。

聚生态之力,联接更多可能

AnyShare Family 7可以与各行各业的生态合作伙伴进行深度应用集成,共同打造强大的内容服务能力。

通过内容总线架构,AnyShare与生态合作伙伴华途融合文档脱敏加密保护、安全共享技术以及新型DLP技术,打造联合的内容安全管控方案,实现商业秘密保护、数据防泄漏。

华途渠道生态部总经理王俊发表演讲

随着越来越多生态合作伙伴的加入,AnyShare将与合作伙伴们一起打造强大的内容功能,从文档安全、在线编辑、PDF内容管理、CAD内容管理、企业管理核心套件等等,实现无限可能的联接。

数据的探索之旅,无边无际,没有终点,但是我们始终不断去突破、寻找技术新天地。

释放海量非结构化数据潜能的钥匙是什么?

是创新,也是坚守,

正如爱数始终坚守的产品哲学:以先进生产力代替落后生产力,

我们终究能击破层层巨浪,打开别有洞天之门。










免责声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。

关键字相关信息: