【头脑风暴】说说监控

Posted on Fri 09 July 2010 in 我思

主持人发言

结合工作,从一下三个方面挑 选一、二发言:

  1. 目的: 监控应该提供怎样的功能
  2. 内容: 哪些地方需要监控
  3. 怎样做:结合工作谈谈怎样监 控系统设计、开发的思路

监控提供的功能

  1. 确认故障点:目前计费报警不是 特别方便定位【葛旭】
  2. 评估服务情况: 给出财务损失报告【李焱】
  3. 服务能力预警: 分析历史数据,根据趋势为服务能力告警【李焱】

内容

  1. 在数据库层面,对统计查询的监 控力度还不够;监控系统的可用性也需要监控【苑琦】
  2. 系 统角度: 网络和硬件的有效性;服务请求总量;服务请求相应时间分布【李焱】
  3. 业 务角度: 计费成功情况、用户成果推送情况【李焱】
  4. 用 户行为角度: 用户行为分析【李焱】

怎样做

  1. 监控报警不够准确,需要加强; 监控系统的可用性需要有保障,也需要监控【苑琦】
  2. 从 基础业务信息获取入手,好好分析一下目前到底能够拿到哪些基础业务数据;然后可以继续深入,提高基础信息的关联性,把基础业务信息和一个用户使用我们产品 的行为关联起来;基于以上的工作,再来和运营讨论业务监控逻辑。【李焱】
  3. 为 每一步操作都做好记录【王征】
  4. 基于纯粹日志分 析的业务监控更合理【苑琦】

如 何获得基础数据【李樨】?怎样知道哪些地方该监控【王征】:

  1. 从外往里:先把系统整体的处理 结果记录清楚,然后划分成大模块,进一步记录日子【王征】
  2. 模 块内部的监控应该由负责模块开发的程序员做【王征】
  3. 现 在每个模块都有日志,但不一定适合监控用,所以需要对监控使用的日志有统一格式要求【宋斌】
  4. 所以开发模块时,开发工程师要和监控工程师商量日志格式【郝庆治】
  5. 需要了解模块的流程,到底有哪几个点需要监控【李樨】
  6. 之前的日志没有考虑到监控【葛旭】
  7. 可以让业务模块主动把日志告诉监控系统【王征】
  8. 监控应该自主获得基础数据【李焱】

怎样制定监控日志格 式?【李樨】

  1. 定义系统模型,共同确认模块交 互逻辑【李焱】
  2. 共同确定监控点【宋斌】: 一起分析模块序列图,共同确认监控点【王征】
  3. 不 断细化,定位越来越精准【李焱】
  4. 接口间的日志 格式,李樨可以出一个规范;接口内的双方共同制定【明飞】

怎样确定用户唯一标示? 【李樨】

  1. 目前没有唯一标示。比如在计费 监控的确定通道号上,是使用uid+时间来确定的,杀毒后续可以用SessionID确定【李樨】
  2. 通管目前没有用户唯一标示【李樨】

会后需要落实的地方

基础业务模型

  • 为要监控的系统定义系统模型,和系统负责人共同确 认模块交互逻辑
    • 可以先从计费和公共服务入手
  • 基础数据整理:
    • 现有:怎样获取
    • 还需要哪些

监控日志格式

接口间的日志格式,李樨可以出一个规范;接口内的 双方共同制定 定义格式规则,并基于现有业务给出事例