现网问题定位与瞬速解决总结

1、系统开发上线前,就要预设测试账号的功能,针对于现网测试账号,在系统中特别打印出日志,当遇到客户功能,
   不可用的情况,可以线上模拟真实的情况。
2、最近是否有对代码进行更新,一般一个系统出现异常,往往最有可能是代码有更新,未考虑
    周全,影响了其他功能。
3、系统部署方式是否有更改,比如WEB服务器的参数,数据库参数,尤其是超时,连接数等参数更改
4、对比测试,代码一样,可以部署不同的环境,做对比测试,往往可以准确定位问题来至于那个功能
    与模块,例如:用apache 方式会报错,但是用测试WEB服务器就不会报错,这样就可以准确定位了
5、操作系统权限规则是否有更改,linux环境,系统权限经常由于设置过严,影响到现网业务,比如
    创建权限的默认权限如果有改动,安装一个插件包之后,只有root可以运行,其他用户都不能运行,
    所以当出现权限问题的时候,不妨用root用户试试运行是否OK。
6、操作系统防火墙,代理,转发规则是否有修改,或者断开
7、系统服务插件是否有修复漏洞等原因导致禁用了某些功能,或者修改的HTTP头的等信息
8、和系统有调用关系的系统是否有异常,最近是否有更新,比如支付等系统,由于接口参数改动,为兼容
    之前的版本,则会出现某些旧的未对接新接口的系统无法兼容,导致异常。
9、割接的时候,是否有用户还在原来的系统中,未退出,导致新上线的系统,无缘无故报错,那是因为用户
    前端加载了旧的系统,未退出系统的情况下,未刷新,导致访问旧的接口或文件。
10、重要的模块,日志一定要清晰,尤其是系统间调用的模块,把系统返回的原生数据写入日志,不要经过
    重新组装之后再写日志,以便于后续系统间对接中日志方便排查。
11、最常规的排查,就是跟踪,一步一步排查,屏蔽相关不影响的功能,从前端到后台,再到数据库,
    直到定位问题。

猜你喜欢

转载自blog.csdn.net/pengwupeng2008/article/details/73466880
今日推荐