【头脑风暴】说说监控
Posted on Fri 09 July 2010 in 我思
主持人发言
结合工作,从一下三个方面挑 选一、二发言:
- 目的: 监控应该提供怎样的功能
- 内容: 哪些地方需要监控
- 怎样做:结合工作谈谈怎样监 控系统设计、开发的思路
监控提供的功能
- 确认故障点:目前计费报警不是 特别方便定位【葛旭】
- 评估服务情况: 给出财务损失报告【李焱】
- 服务能力预警: 分析历史数据,根据趋势为服务能力告警【李焱】
内容
- 在数据库层面,对统计查询的监 控力度还不够;监控系统的可用性也需要监控【苑琦】
- 系 统角度: 网络和硬件的有效性;服务请求总量;服务请求相应时间分布【李焱】
- 业 务角度: 计费成功情况、用户成果推送情况【李焱】
- 用 户行为角度: 用户行为分析【李焱】
怎样做
- 监控报警不够准确,需要加强; 监控系统的可用性需要有保障,也需要监控【苑琦】
- 从 基础业务信息获取入手,好好分析一下目前到底能够拿到哪些基础业务数据;然后可以继续深入,提高基础信息的关联性,把基础业务信息和一个用户使用我们产品 的行为关联起来;基于以上的工作,再来和运营讨论业务监控逻辑。【李焱】
- 为 每一步操作都做好记录【王征】
- 基于纯粹日志分 析的业务监控更合理【苑琦】
如 何获得基础数据【李樨】?怎样知道哪些地方该监控【王征】:
- 从外往里:先把系统整体的处理 结果记录清楚,然后划分成大模块,进一步记录日子【王征】
- 模 块内部的监控应该由负责模块开发的程序员做【王征】
- 现 在每个模块都有日志,但不一定适合监控用,所以需要对监控使用的日志有统一格式要求【宋斌】
- 所以开发模块时,开发工程师要和监控工程师商量日志格式【郝庆治】
- 需要了解模块的流程,到底有哪几个点需要监控【李樨】
- 之前的日志没有考虑到监控【葛旭】
- 可以让业务模块主动把日志告诉监控系统【王征】
- 监控应该自主获得基础数据【李焱】
怎样制定监控日志格 式?【李樨】
- 定义系统模型,共同确认模块交 互逻辑【李焱】
- 共同确定监控点【宋斌】: 一起分析模块序列图,共同确认监控点【王征】
- 不 断细化,定位越来越精准【李焱】
- 接口间的日志 格式,李樨可以出一个规范;接口内的双方共同制定【明飞】
怎样确定用户唯一标示? 【李樨】
- 目前没有唯一标示。比如在计费 监控的确定通道号上,是使用uid+时间来确定的,杀毒后续可以用SessionID确定【李樨】
- 通管目前没有用户唯一标示【李樨】
会后需要落实的地方
基础业务模型
- 为要监控的系统定义系统模型,和系统负责人共同确 认模块交互逻辑
- 可以先从计费和公共服务入手
- 基础数据整理:
- 现有:怎样获取
- 还需要哪些