据观研报告网发布的《中国智能运维行业发展现状分析与投资趋势预测报告(2023-2030年)》显示,IT运维工作从早期的手工运维转变为自动化运维,极大地减少了人力成本,降低了操作风险,运维效率得以提高。不过,自动化运维带来改变的同时,其本质依旧属于人与自动化工具相结合的运维模式,仍存在无法适应复杂环境和变化,无法做出智能决策,影响系统稳定性等问题,受限于人类自身的生理极限以及认知局限,无法持续面向大规模、高复杂性的系统提供更高质量的运维服务。
由于自动化运维仍在一些方面存在短板,于是促使了更加安全、高效、可靠的运维方式出现,IT运维发展也进入到第三阶段——智能化运维阶段,该阶段进一步弥补了自动化运维的不足,通过引入人工智能和自动化技术,以提高运维效率并降低故障风险,从而实现了更高水平的运维管理。目前,主流运维技术已从自动化运维向智能运维发展。
从自动化运维升级到智能化运维,是伴随着我国互联网企业蓬勃发展而产生的必然结果,先进的互联网企业通过发展智能化运维,推进了智能运维成为数字化浪潮下新一轮企业竞争、资本投资的新风向。2017年,云空间安全运维专家司宇加入微店负责系统运维、资源管理及监控系统、虚拟化系统的开发管理,他帮助企业成功打造了智能化运维平台并自主研发了监控系统。智能化运维平台的打造主要为智能运维提供了数据支持、自动化、智能决策等关键功能,帮助企业提高了运维效率,降低运维成本,而智能监控系统则通过实时监测、自动化告警、预测等功能,为智能运维提供了重要的支持和基础,帮助运维团队更有效地管理和维护了系统。这两项研发为智能化运维的发展作出了重要贡献,也为司宇在行业内获得更高认可度起到了关键作用。
在积累了成熟的项目经验过后,司宇进入我国一家知名互联网企业担任该集团监控中心负责人,他通过继续运用智能监控领域的专业知识发挥个人价值,主要负责集团监控系统建设,承载集团日常及活动超过90%的监控,日志处理峰值可达120T/分钟。他通过使用智能算法,实现了对周期监控数据进行无阈值异常检测,提升故障监控发现率,重大故障监控发现率达90%以上。除此之外,司宇开发了智能故障管理平台,实现集团经济体各BU故障全生命周期线上化管理,通过移动故障应急、智能故障定位,实现集团内80%重大故障10分钟恢复。司宇对集团带来的贡献受到高度认可,谈及这些举措对于公司和行业具有怎样的意义时,他阐述这对于企业而言极大提高了系统的稳定性和可靠性,降低故障发生的风险,保障业务连续性,并且通过自动化优化监控和管理过程,减少了人工干预,降低了维护成本,对于行业发展而言,意味着智能运维发展迈上新台阶,变得更高效、更精准、更可靠。2021年,司宇因在计算机运维领域贡献突出,被获批准加入中国科创协会,正式成为协会会员。
司宇目前的工作重心主要放在云服务领域,他深刻意识到了云上服务对于企业、社会的重要性,致力于维护互联网服务稳定性及提高运营效率,为企业客户提供云上智能监控产品专家服务,通过产品工具解决方案,服务云上客户,持续提升客户用云体验。他打造了专家工作台,用来提升客户用云工单处理效率,还为企业提供了报警智能定位,通过对客户报警进行智能化定位,提升了客户云上风险处理效率。“云服务能够不断获得发展,得益于智能运维带来的多方面帮助,从减少故障到提高性能,都有助于升级云服务的质量和效率,满足客户需求,我非常乐意为云上客户提供更好的智能运维、故障管理等线上化稳定性保障服务”司宇说到。(文|刘明)