在AIOps的趋势下,谁会成为中国市场的创新者?
2019-04-25 15:35:30   来源:互联网
内容摘要
    创新让所有公司站在了同一起跑线。    以AIOps为例,这个以AI为核心能力提升运营和运维的技术趋势,让IBM、BMC、Moogsoft、Splunk和云智慧这些大大小小的新老公司有了同台竞争的机会,这在过去是不可想象的。     在这条以技术创新、理念创新和服务创新为资格的跑道上,哪家先…

    创新让所有公司站在了同一起跑线。

    以AIOps为例,这个以AI为核心能力提升运营和运维的技术趋势,让IBM、BMC、Moogsoft、Splunk和云智慧这些大大小小的新老公司有了同台竞争的机会,这在过去是不可想象的。

 

    在这条以技术创新、理念创新和服务创新为资格的跑道上,哪家先越过起跑线,哪家就有可能成为这个新兴市场的领导者。如果仍旧停留在AI+Ops的概念中,就难以跳出传统运维的窠臼。

 

    在这些厂商中,云智慧是唯一的中国公司,员工300多人。这几年一直坚守技术创新,以运维为核心,不断向业务的边界拓展,最终进入了AIOps这个大市场。

 

    云智慧有可能胜出吗?

 

    如何定义智能运维?

 

    对于业内来说,“智能运维”并不陌生。

 

    但是对这个词的概念,各类公司理解并不一样。大的互联网公司聚焦在基础设施层面,从计算、网络、存储、云等设备支撑业务的角度出发,关心如何确保稳定性,安全可靠,这就形成了各种智能化、自动化的解决方案。传统IT大公司的做法是,打包销售整体解决方案,顺手做了智能运维,属于典型的“自恰”,相对封闭。而专门做运维的公司,则是从运维的角度出发,对IT设备的管理要“纵到底 横到边”,几乎囊括所有的设备、数据、甚至是业务,但真正落地的是工具型的APM,目前应用有限。

 

    随着AI发挥越来越重要的作用,运维转向了AIOps。

 

    以2012年成立的Moogsoft为例,人数不超过200人,在短短6年内融资过D轮,总计为9000万美金,是运维行业中发展快速的一家公司。

 

    为何能够获得市场追捧?因为它的AIOps概念“横空出世”,更有研究机构称之为“搅乱和创新了一个市场”,将原有的运维市场概念全新定义。

 

    研究机构的定义是:把机器学习、深度学习等自动化模型发现算法应用于IT运维工具和业务系统所采集的大型数据集,并尝试模拟人类行为(如发现、判断、响应)的智能化运维管理平台。

 

    AIOps创造了新的市场。

 

    迎来爆发式发展

 

    到2016年左右,AIOps市场开始启动。

 

    这时候,中国厂商云智慧已经着手研究AI,招聘了数十名研究生、博士和深入算法的工程师,看如何应用于运维领域。按照云智慧总裁刘洪涛先生的说法,“当时也在深入研究人工智能的方方面面,差点重新造算法这个轮子了。”

 

    到了2017年左右,市面上所有做DevOps、自动化运维的厂商开始转向AIOps,同时有大量初创企业涌现,不管真真假假。这些初创公司的核心团队多来自大型互联网企业,按照BAT自己建设AIOps的思路成立,其产品特点在于能够满足互联网应用场景和相对单一的云环境的需且,却无法解决复    杂的传统IT环境、异构信息化系统和企业定制化的私有云环境的统一管理和智能运维的需求。

 

    而那些老牌的IT厂商呢,仍旧是为了满足传统IT场景下的IT资源管理、IT服务管理、IT 自动化等需求,偏向于用AI的思路解决底层设备的一键部署、一键升级等规模化、标准化的运维问题,而不是融为一体的AIOps。

 

    像Moogsoft、云智慧这类新型的AIOps平台和解决方案,围绕业务这个核心实现从底层设备、系统应用、云环境、微服务到网络环境、前端业务的完整交易链路追踪、跨系统追踪,更符合数字化转型和混合IT的场景。这也是为什么Moogsoft能迅速成长,云智慧能获得市场认可关键原因。

 

    市场开始变得微妙起来。

 

    技术难点1:如何抓取企业数据?

 

    如果说,运维的未来是AIOps,那么,为什么有些公司能做,而有些公司不能做呢?这与公司的战略、市场和技术实力息息相关。

 

    从市场规模来说,整个AIOps市场缓慢启动,预计到2020年左右随着AI的普遍应用而真正成熟。这意味着,对大公司而言,当前并不是一个上百亿元、上千亿元的大市场,不会关注。而对那些上百人的小公司而言,没有一定的积累不会将未来“押”在这个未知的市场中,只有像云智慧、Moogsoft这类对运维有深度了解,一直深入研究并有大量客户(包括传统客户和新兴互联网客户)的公司才会往前迈一步。

 

    当然,并不是所有公司都能做AIOps,这里面还存在技术、部署和交付方面的问题,需要跨越几个技术难点。

 

    首先,如何抓取企业内部的数据。理论来说,数据(数量、类型)越多越好,颗粒度越小越好,数据质量越高越好,但各个企业的软硬件环境不同,导致获取数据的难度较大。在信息化基础较好,重视运维的企业中,各类数据相对容易获取,这也是为什么金融类企业率先采用AIOps的原因之一:数据基础好,效果容易凸显。

 

    当前,随着云计算的应用、IoT的发展,传统IT的边界被打开,运维也从中心走向 “边缘”,出现了更多终端、更多数据类型,即便强如IBM这样的传统IT公司也不可能将所有的数据采集完整。

 

并且,如何将所有的数据实时汇聚(抓取)到平台也是一个大问题,没有实时海量数据处理能力,是无法承担这一重任的。特别是当故障发生时,成千上万条告警信息在同一时间段蜂拥而至,更需要强悍的数据平台和分析能力。

 

    而这对深耕网络运维近10年、拥有PB级数据处理能力的云智慧来说,并不是问题。云智慧的做法是,以数据能力为基础,擅长的领域(比如用APM在应用中打入探针抓取性能数据)自己做,不擅长的领域与合作伙伴合作,通过开放的平台将数据收集完整,包括数据的来源、数据的颗粒度大小、数据的种类等等,只要做好不同运维工具和ITSM工具之间的跨工具集成,才能让AI有用武之地。

 

    技术难点2:如何搭建统一管控平台?

 

    一旦数据汇集起来,这就涉及到第二个问题,如何构建高度可扩展的统一管控平台?

 

    从AIOps的落地形式来看,最终是搭建一个对用户有价值的仪表盘(或叫做驾驶舱)。什么样的数据该放在仪表盘上,这就需要根据客户的需求决定。一般来说,CIO感兴趣的是业务的健康程度,也就是系统的运行状态,不要为业务带来麻烦。而CEO关心的是,业务能否正常、高效运转,IT为企业创造了多少价值。无论是CIO还是CEO,都不会“真正关心” IT的问题。这就需要运维厂商具有灵活定制能力。

 

    云智慧DOCP数字化运维中台

 

    云智慧能为企业客户抽取、展现不同类型的数据,以满足不同用户的需求。这涉及到数据抓取和关联分析、对数据的分类和应用,需要从结果导向对数据有洞察,做到提前预警和判断。

 

这对运维厂商的数据处理能力、系统集成能力和方案实施能力提出了极高的要求:能否提供松耦合和模块化的解决方案,能否具有通用的运维能力+行业定制能力。最根本考验的是厂商对行业的理解和对产品、技术、解决方案的落地能力。

 

    技术难点3:如何更智能

 

    从前两个阶段来看,经过了数据的采集、聚合之后,就要进入最关键,也是AIOps的核心所在:如何分析和解决问题?其实,这也是传统运维工具的职能所在,不过是价值点发生了转移,AI让这一切更具有预判性和洞察力。

 

    这有几个层面的事情。首先是AI具有洞察能力,牵扯到算法、算力和数据这三大因素。比如像云智慧拥有数十人的算法团队钻研算法的工程化应用,这是和其他运维公司有本质的不同。其次就是应用什么样的方法论,告诉用户什么样的结果,该怎么处理,如何在千万条告警数据中准确发现异常?

 

    举例来说,北京飞纽约的机票价格区间在3000元~13000元之间,波动很大,5000元的价格算不算异常?如果在淡季期间,这是正常价格。如果在圣诞期间,这就不正常。这其实就需要更多行业背景,通过对历史数据的机器学习,有效的设定动态基线和动态告警阈值,第一时间发现指标的异常,通过根因分析准确定位到故障源头,并把这一切根据事件的级别,第一时间呈现在运维、运营和管理者的面前。

 

    目前,AIOps平台的ROI多是根据平均故障接手时间(MTTA)和平均故障修复(MTTR)时间这两个指标来评估的,而云智慧在某证券行业头部企业的智能运维项目中,MTTA从原来的25分23秒降低到4分16秒,MTTR从78分39秒降低到27分52秒。

 

    刘洪涛说:“用户不关心通过什么算法生成动态基线,而需要供应商帮忙解决实际场景的问题。云智慧为用户提供场景化、工程化的智能运维解决方案,尽可能减少用户的工作量,把AI的能力和大数据分析能力输入到所有运维管理工具和流程中,为用户呈现最有价值的结果。”

 

    核心是,如何拥有AI能力、如何让AI能力通过AIOps平台在运维体系中发挥最大价值、如何具有行业经验。

 

    总结:云智慧是否能胜出?

 

    说了这么多,基本你对AIOps的市场前景有一定了解,它是遵循数字化理念构建的新一代运维,是智能化的运维,而不是消灭传统运维。它可提供增强的分析能力和更具可操作性的数据,就像一个镜头,把数据集中到单一、连贯的跨域分析之中。

 

    我们从各个维度分析了AIOps的未来前景,那么作为中国代表性厂商,云智慧会如何发展?这里可以给几个判断。

 

    作为多年沉浸在运维领域的厂商,云智慧对这个市场足够了解,对AIOps有判断有预期还有行动。从理念来说,至少领先国内厂商2~3年,几乎与国外厂商齐头并进。在这种理念驱动下,云智慧大力投入资金、人力和时间成本,已经在市场中占据主动位置。

 

    其次,在技术、产品和解决方案一系列落地的过程中,云智慧基于多年积累的大数据处理能力和对AI的应用实践,已经形成一套以DOCP数字化运维中台为核心的智能运维产品解决方案,通过良好的开放性帮助企业实现后台IT运维体系和前台业务运营体系的打通和关联,并逐步形成IT融合和IT驱动。

 

    最重要的是,云智慧这一套以AIOps为核心理念的数字化运维平台可为用户带来更大的价值。当前已经在金融、航空、物流、运营商、制造、房地产、零售快消等行业实现场景化落地。由于部署简单、具有松耦合和模块化等特点,可以让用户跳出过去狭隘的IT运维观点,最大程度驱动业务价值,这恐怕就是更多新一代CIO和CEO们关心的问题了。







免责声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。

关键字相关信息: