Top
首页 > IT产品和服务 > 云大数据 > 大资讯 > 正文

ArchSummit应用性能管理(APM)专场都谈了些什么?

而随着业务级运维、敏捷开发的兴起,应用性能问题对于企业关键业务的影响正变得愈发重要,而APM(Application Performance Management)应用性能管理也同样越来越受到企业的重视。
发布时间:2015-07-22 10:49        来源:赛迪网        作者:卢敏

7月17日,ArchSummit 2015全球架构师峰会在深圳大梅沙京基海湾大酒店如期举行,近千位参会者伴着蓝天美景来到大会现场,十多个分会场在不同方面展示着新技术在行业应用中的最新实践与技术在企业转型中的加速作用,帮助作为企业技术管理者、CTO、架构师们的参会者做好技术选型、技术团队组建与管理。

而随着业务级运维、敏捷开发的兴起,应用性能问题对于企业关键业务的影响正变得愈发重要,而APM(Application Performance Management)应用性能管理也同样越来越受到企业的重视。APM,即对软件应用的性能和可用性进行监控和管理,目的在于发现、定位应用性能瓶颈与故障,以保证应用达到目标服务水平并最终实现预期的用户体验。本次大会特别设置了应用性能专场,来自国内APM领导品牌听云技术副总裁吴静涛、移动研发总监江赛以及正在进行APM实践的腾讯社交平台业务运维组高级工程师梁定安老师、OPPO数据中心总监黄良懿先生,共同为在场观众分享了来自不同领域关键业务在APM上的技术实践经验。专场异常火爆,短短的一下午的时间里,源源不断的参会者闻讯而来,更有很多朋友站着听完整场演讲。

1

2

互联网+时代下的业务级运维

首先登台的是听云副总裁吴静涛先生,他谈到在过去的十年,数据中心几乎都是以应用为中心构建的,可面对现在90后的客户,我们慢慢的转化成以客户为中心,以用户为中心的第三代平台,所以我们更希望构建以智能终端+云服务为结构的新平台。当应用开发过程变得非常快,迭代速度也非常快的时候,问题也就随之而来了,有的用户会投诉说“网络慢,体验不好”等等问题,在责任分辨不清的时候,听云希望做的一件事情就是把从客户端的移动App开始,把整个流程打通,从头监测到尾,让所有的研发、运维、负责网络的工作人员都在一个平台上看问题,来检查用户访问体验,应用的运行效率以及义务运行是否正常。

听云对于每个部门的业务价值都是不一样的,CTO和CIO作为公司高层最关心的是配合业务,如果用户体验可量化的话,便可以建立用户体验为基准的KPI体系。对于业务而言,把闪退和卡顿的问题解决掉,客户就留下来了,提高5%的客户留存率,会收获几百倍或是千倍的投资回报率。对于产品和研发而言的话,最重要的是快速发现问题和解决问题,加快迭代的效率,而且迭代之前,可以帮助判断问题,确定业务的可用性。同样,听云对于运维也是有相当大的帮助的,让运维部门脱离以前的低级的运维,开始进入业务级的运维,才是真正运维2.0概念。

3

亿级社交平台的应用性能优化实战

经过短休之后,腾讯运维高级工程师梁定安为大家带来了《揭秘腾讯社交网络APM平台实战》的演讲,他讲述了ITOA的演进。目前,ITOA的高级产品形式分为三类,分别是APM类、日志分析类、端到端监控类。APM类优势在于适合遗留系统,IT能力弱与性能问题频发的组织,而用了APM产品可以降低故障定位时间,提升用户体验,同时面对的挑战是微服务与标准化。日志分析类优势在于更贴近业务的日志获取,更多元化的日志分析,会有更具有价值的数据呈现,可以降低故障定位时间,提升用户体验,提升IT运营的业务价值。

ITOA之立体化监控优势则在于更加贴近用户的故障发现能力,有更全面的故障告警能力。然而监控理念的变化,对数据的多维度处理则是立体化监控未来将要面对的挑战。随后梁定安老师谈到腾讯的运维体系中立体化监控分为端到端监控,用户端监控,服务端监控,基础监控四个维度。而面对海量服务,ROOT是端到端智能监控的一大工具,它基于业务架构,结合数据流关系,通过时间相关性、面积权重等算法,将监控告警进行筛选分类,发掘有业务价值的告警,并直接分析给出告警。最后在总结中梁老师说到,每款互联网产品面对的问题不尽相同,Devops协同合作的前提下,将价值最大化才是我们共同寻求的目标。

4

移动互联网时代,是什么影响了你的应用?

短暂茶歇过后,听云移动研发总监江赛带来移动应用性能的分析与总结,他从“怎样去评价一款应用是优秀的移动应用、影响移动应用系统的罪魁祸首、如何写出高效代码、运用技术手段监控应用性能、移动应用性能常见的性能指标” 五个方面来阐述。一般情况下,获取程序运行时的信息来源有用户投诉和应用日志,但我们随时会面对偶发性故障,无法定位等问题。

怎样才算是优秀的移动应用呢?当iOS崩溃率超过8‰、Android崩溃率超过4‰时,应用将进入轻微隐患阶段,错误率超过20‰,便是严重隐患,想要成为优秀的移动应用并不容易,又是什么影响了移动应用性能,谁是罪魁祸首?比如说连接超时、崩溃、黑屏、闪退、网络劫持等等都有可能是重要的影响因素。

谈到利用应用技术手段来监控应用性能,江赛老师谈到对于听云来说,核心的是两部分一个是监测手段,我们怎么去抓取监测数据;数据的处理能力,大数据的处理能力,这两部分是我们核心和我们的优势,也是我们技术积累比较多的一部分,也是我们和普通厂商有区别的一部分。

最后提出了可以衡量一款App的性能情况的五大指标:分别是:Crash指标、慢交互指标、交互指标、网络访问指标、错误指标。随着移动智能设备的迅速发展,经国际电信联盟统计,2014年全球手机用户达到了70亿、中国手机网民总数为6.23亿,这样亿万量级庞大而复杂的网络环境下,应用性能问题是每个移动互联网从业者应该重点关注的问题。

5

如何打造用户访问全网的极致体验?

来自OPPO数据中心的黄良懿总监是压轴出场的讲师,他为在场观众分享的是关于《全网访问速度优化》的内容,首先他提到为什么要优化,当沉重的网络带宽、服务器压力来临时,一个24小时打开的浏览器将给我们带来3万多次web请求,虽然我们看到的页面快,但用户层面却不是这么认为。

而全网访问速度优化分为四个方面:网络优化、服务端优化、浏览器前段优化以及移动客户端优化。第一,网络优化要注意DNS问题,我们知道DNS一个多层缓存的一个技术,只要你的网站知名度比较高一点,访问人多一点,基本上你去访问的时候,这个网站出了你的访问之外,他就已经有缓存了,但是做网络优化会有一些指向的一些切换,在这个过程中我们注意一下TTL和DNS Server的线路,还有就是TTL的生效时间,如果我进行了一个DNS切换的话,我们必须保证前后两个落点的地址基本无Access Log。

另外网络优化要同时兼顾线路与前端,线路是硬件,决定了整体的性能,前端是软件,决定了客户端的吞吐。第二,面对服务端优化,需要尽早的刷新缓冲区,同时加速页面生成时间,需要注意异步 API / 并⾏行处理、基于消息总线、单请求打包多调⽤用+多线程、异步请求回调框架以上四点。第三,浏览器前端优化需要在指导守则的基础上,调优常用工具,降低请求数与传输量,提高并发性能,加速可响应时间。另外需要注意的一点是合理利用带宽,不仅可以节约成本还可以提高并发服务能力。最后一点客户端优化,应当进行数据访问策略的优化,区分优先级,连接复用或合并请求等等,同时要突破Webview的局限性。做到以上四点,才是最全面的全网访问速度优化过程。

6

合作站点
stat