1207亿是怎么计算出来的?它的背后其实是阿里的一个数据生态
其实数据大屏展现的模块,与阿里在今年年初提出的“全球化、农村、大数据和云计算为核心的三大战略”是契合的,这块屏幕就是这一年来对阿里整体战略实践的解读。
每年双11都会有新的玩法带给大家更惊艳的购物体验,玩法的多样性、复杂性都会对我们提出更高的要求:尤其是当流量、交易量达到高峰的时候,如何在完成更复杂的数据逻辑处理的基础上,依然保障数据处理的效率。
2009年的第一次双11,交易峰值仅为400笔/每秒,支付峰值仅为200笔/每秒,而今年双11开场的第一个小时,就涌入1.2亿用户,阿里的交易系统也创造了每秒交易峰值17.5万笔,每秒支付峰值12万笔的新纪录,八年增长了数百倍。
同样对于数据团队来说,压力最大的也是11号凌晨,即双11到来前的一个小时,又以前十分钟压力最大,必须要在高峰的时候既要保证数据逻辑的正确,又要保证数据处理的效率。“扛过第一个小时,这一整天基本就能抗住了。”而如果说第一分钟的压力来自交易笔数的并发量,那么最后一分钟的压力在于最终数据的准确度。“我们要考虑任何的环境不稳定带来的数据抖动,来保证最后时刻的数据,和你将来回过头看的离线数据是一样的。”
压力下的决断:“你们不要手抖”
“你们不要手抖”,是王鹏时常挂在嘴边的一句话,作为技术人员,点鼠标的时候要慎重果断。但是即使是王鹏这样经历了大风大浪的人,依然充满了对数据的敬畏,对于他来说,数据的迷人住处也在于它的不可控。“比如今年有很多内容化的玩法,包括晚会的时候,我们不确定什么时间点会产生流量峰值。”
去年第一届双11晚会时,王鹏就被惊出一身汗,“晚会对我们来说是第一次尝试,经验也不足,我们预估达到流量峰值的时间提前了1个小时,刚开始的几秒钟还是挺慌的,还好做的预案比较完善。”
尽管在双11前已经做了无数次压力测试,但是王鹏表示,复演的过程与真实的情况永远存在差异,所以在双11之前,“我们内心其实都还挺恐慌的”,不过只要前十分钟一过,团对所有人都淡定了。
为了应对各种不确定性,数据团队做了几百条预案,虽然可能最后大部分都不会触发,但团队想了很多可能出现的突发状况,比如说交易量超过峰值,平台要怎么去应对。
今年的整个数据系统,王鹏表示采用了“三链路”保障体系,“目前日常情况下,我们是双链路,一个链路有问题的话,不到一秒的时间就能切换到另一个链路上,不过今年因为交易场景的增加,所以我们升级了自己保障的能力,针对媒体大屏有单独的链路来保障。”
在操作层面,今年也有很多升级,主要集中在自动化能力的提升上面:比如今年的链路一键切换,屏蔽掉人为操作的所有中间环节,用王鹏的话来说,“手抖一下也不会坏事”。以及今年的大屏远端监控工具,在任何地点都可以通过技术指标的波动来第一时间识别大屏的性能和稳定性风险。
数据产品的三个战场
阿里巴巴数据技术及产品部资深总监小芃告诉《天下网商》记者,数据团队主要有三个战场,一个是面向媒体的数据大屏,一个是面向商家端的数据大屏,一个是面向平台内部各业务小二的数据大屏。虽然这些针对不同用户的数据可视维度不同,但是共用一个数据公共层。
“比如像商家端的数据大屏,最早是起到店铺数据实时监测的作用,逐步生出了团队激励、多个子品牌的数据同步显示的需求,以及到今天还有社会分享、对外披露的需求。”所以今年,生意参谋推出的升级版双11作战大屏上,不仅能实时展示店铺支付金额、支付件数等核心经营数据,还将实时、同屏呈现店铺所在行业排名、竞店排行、店内热销商品榜、店铺买家画像等更多内容,可以满足商家对数据可视化的多维度诉求。
相关新闻:
0条评论
网友评论