【提纲】- 关于“监控”的头脑风暴

Posted on Thu 08 July 2010 in 我思

监控的目的 确认故障点 分析历史数据,预判故障

- 监控具体的工作内容: 按照对目前工作的认识,监控由下往上分为系统监控、业务监控、用户监控 系统监控包括: 网络和硬件的有效性监控;服务请求相应时间、服务请求总量等 业务监控:包括基础业务数据信息获取 用户监控:从基础数据中基于用户标志进行关联组合,获得用户行为

监控还包括阈值判断、触发报警判断等功能

- 怎样来做: 目前的监控系统建设交给运营支撑线去做,有些过于纠结于运营部门提出的业务逻辑。最好从基础业务信息获取入手,好好分析一下目前到底能够拿到哪些基础业务数据; 然后可以继续深入,提高基础信息的关联性,把基础业务信息和一个用户使用我们产品的行为关联起来; 基于以上的工作,再来和运营讨论业务监控逻辑。

也要思考怎样做服务可用性的监控。