合拍在线:听云应用性能管理(APM)下的互联网金融运维实践
2015-07-28 09:46:58

      城里人还是会玩的,如今股市动荡,国家救市收效甚微,4000点的徘徊让人心急难耐,投资P2P成为下一个热点并不出奇,其实归根结底还有很多很多原因,银行利息太少、基金成本太高、债券风险太大、黄金升值无望等等等等,更耐人寻味的是,近期国家对互联网金融持更多的支持态度,转战P2P的投资者自然越来越多。

      那么问题来了,“P2P”们是否已经做好了准备迎接不断涌入的客户呢?等待问题发生再去解决的运维模式早就过时了,不走在用户前面,池子建得再豪华也接不住任何东西。成立3年,业务量从1亿到100亿,侧重中小型企业的P2P互联网金融企业合拍在线可以解答这个问题,为我们揭秘百亿级的业务平台运维背后的秘密。

      互联网金融为什么要用APM

      立志于做最安全的P2P网贷投资平台的合拍在线,一直坚持和担保公司密切合作来降低投资风险。融资方通过线上注册,发起的融资请求经合拍在线审核后,再交给当地与合拍在线进行合作的担保公司进行实地调查,最后把融资请求放到合拍在线上供投资人进行投资,这种运作模式注定了线上投资人的用户体验及资金安全至关重要。“我们的投资客户几乎没有风险,第一重保障是有实力的担保公司担保,第二重保障是我们公司有2000万准备金。我们的投资门槛也不高,所以适用人群和类型比较广,这就表示我们的用户会分布到全国各个角落,管理起来很麻烦犹如盲人摸象。”合拍在线的运维经理张超如是说。

      盲人摸象其实并不难解决,关键是找对手段。因为南北网络差异,大江南北的用户访问合拍在线时不时会出现访问慢或者访问失败的情况,这常常困扰着运维人员。“我们会接到用户反馈网站打开慢或者访问不了,再去解决时候过于被动,所以我们需要一个手段能模拟全国用户从全国各个地方访问我们的服务器,通过这个手段知道我们网站目前的情况是什么样的。”这个手段便是听云Network。

 

 

1-150HG3391LR.jpg

 

      听云Network可以提供不同视角下详尽的监测报表,清晰的帮助合拍在线了解网站的各项性能,真实了解用户体验,提高网站访问响应速度,主动留下用户。“我们利用听云Network从全国32个省会城市对网站进行检测,保证最佳用户体验,同时还能对 CDN进行全国监控和评估,知道全国范围内的网络访问情况如何,心里多多少少有个底。”张超说到。CDN加速效果评估一直是盲点,只能大概的感觉到有一定效果,利用听云CDN监测不仅能对一般情况进行监控,还能以此为依据也可以跟CDN加速厂商反馈,进一步提升合拍在线全国用户体验度。

 

1-150HG3411L11.jpg

 

 

      “那些小的网络运营商不如大运营商透明,很难对他们进行评估,听云Network对小运营商的监控支持帮了我们很大的忙;同时用户访问网站的问题,比如说网站加载错误,第三方插件或域名出现加载错误等一些情况,我们也可以看到;还有听云Network每月出的报告,对网站的性能做一些综合性的评估,我们也能据此对网站做针对性的优化。”在说起听云Network的优点时,张超对于听云Network细节上的把控赞不绝口。“这节省了我们很多运维上的人力物力和时间。”

      运维要走在用户前面

      在提及合拍在线手机端时,运维经理张超直言现在合拍在线App主要是PC端以外用户在合拍上进行投资的有益补充工具。能满足用户查看,投标,充值等基本功能,交易量占总量的20%。“移动端的发展肯定是未来的趋势,用户会慢慢习惯于利用碎片时间在手机上进行理财,合拍在线App在未推广的情况下能占到交易总量的20%足以说明这一点。” 张超说到,“听云APP的对手机端的监控,可以得到全国运营商,区域,接收方式等我们最想要的信息,能知道用户访问的情况和响应度等,让我们走在用户前面,不再被动等待用户反馈。”

 

 

1-150HG3420E49.jpg

 

      旧的运维方式永远是关注当下,运维人员常常被描述成救火队员、抗洪斗士,其实可以不这么艰难,提前预知,提前准备,一切会变得很轻松。“随着业务的发展,势必会遭遇网络拥堵,高并发请求,更甚者被攻击和APP劫持等情况都会发生,未雨绸缪,未来必须得有一个手段去知道发生这种情况时是怎么样的状况。”这就需要听云App和听云Server双管齐下。

      “高并发请求状态下APP和server端都会出现情况,后端性能如系统资源使用情况,程序运行情况,运行中出现的内部错误,异常等情况都需要进行监控,通过听云Server设定阀值,出现异常错误或者超过阀值时候报警,整个应用出现性能瓶颈需要人工干预了。” 张超进一步说到未来可能会发生的情况。“手机端的话最主要的几点分别是:用户网络环境、APP端响应时间和崩溃情况。用户在使用过程中出现异常或者崩溃时,我们要知道出现的异常是什么,为什么出现,是什么导致崩溃出现,这些都是最影响用户体验的点,也是听云APP最有价值的点。”

      “三位一体”才是终极形态

      有一款游戏叫做“三位一体”,需要玩家控制功能不同的三个角色互动才能在游戏里过关斩将,对于APM来说也是如此,App、Server、网络端缺一不可,Gartner的APM分析师也曾说过超过60%的公司会使用6款以上监控工具,统一势在必行。“我们之前也用过一些其他的监控工具,但都是对不同方向独立的监控,整体效果不如听云,三端连贯在一起,更有互通性。” 张超在提及听云端到端应用性能管理时说到。

      “假设我们App出现一个问题,我们会分析,是开发的关系还是后端服务异常?如果是APP端的问题我们要进一步代码级分析是代码构建的问题还是BUG,还是前期应用程序的关联导致的?如果是后端的问题,根据错误去看后端相关的代码是不是某个接口性能有问题导致响应出现异常,导致APP崩溃,这些都需要前后端统一来一起看。”端到端的应用性能管理让我们对应用有完整清晰的认识,从而才能建立完善的应用监控基准和体系,方便我们日常的运维工作,全方位的维护应用正常工作。

      在继续聊到APM的使用时,张超偶有感概,我想我能理解他的心情,长期的一线运维工作犹如摸着黑夜里赶路,永远不知道下一个绊儿在哪等着你,APM便是一盏指路明灯,让运维人员能在夜路好走一些。“100亿只是开始,未来我们势必面对更多挑战,我们也会勇于面对。”当然,这一路听云仍将相随。

来源:

  • 上一篇 :工信部:推进工业云、工业领域大数据
  • 下一篇 : 张峰:云计算已经成为“互联网+”的平台
  • 相关信息