首页 > 科技 >

首次公开!阿里巴巴搜索中台开发运维一体化实践(3)

2018-08-01 14:44:47 网络整理 阅读:134 评论:0

但只做到DevOPS对于阿里这样体量的..就完美了吗?显然不是,全链路的DevOps只是有效解决了研发、PE、用户配合效率和用户使用体验的问题,但是对于..方来讲随着业务规模的急剧膨胀,以及搜索服务类型的复杂多样及多变,业务跟..的矛盾其实又发生了本质性的转移:如何给在海量规模下为每个业务提供更好的稳定性保障和合理的资源利用率、以及更高的迭代效率等就成为了我们..新目标。

目前我们基于在AIOPS数据化运营的3年实践中落地了Hawkeye -在线服务优化..、Torch-容量治理..、Heracles-日常压测服务化..、CostMan-成本服务等系统。这些服务系统帮助..在容量管理,日常巡检、一键诊断优化上取得了一定的阶段性成果,也让我们对未来统一集团搜索运维管控,业务数量即使超过10000+规模效应下..也能应对自如,树立了坚定的信心。

虽然经过3年的数据化运营的实践,但我们离真正的AIOps还有较远距离,因为之前我们的性能瓶颈分析、问题诊断、故障自愈、复杂运维决策主要还是停留在专家经验沉淀上,说白了还是把人的经验沉淀到系统来解决线上运维的问题,而AIOPS期待的是用数据和算法能力帮我们自动地发现规律问题并解决问题,从这点上看AIOps在我们的..依然还有非常多的潜力可挖,所以我们希望未来在效率提升、质量保障、成本优化上能真正借助AI的能力帮..更好地适应未来的发展。搜索中台开发运维一体化实践-Sophon开发运维一体化-DevOPS

在我们介绍开发运维一体化-sophon的系统前,我们先看看一个稍微复杂搜索场景的业务接入时需要涉及到的系统以及他们是如何协调工作的。

首次公开!阿里巴巴搜索中台开发运维一体化实践(3)

从上图其实大家看到整个系统模块大致分为3大模块,OPS、Online、Offline。其中如图所示Ops层很明显分成了在线有状态服务ops、在线无状态服务ops和离线ops。

相关文章