2022年1月31日晚22:00,正是酒足飯飽、萬眾期待的搶紅包環(huán)節(jié),春晚主持人剛剛說出紅包口令,京東春晚“重?!表椖恐笓]部傳出了一句簡短的口令:
“斷網(wǎng)!”
就在流量峰值最高的時候,京東機房的一根網(wǎng)絡專線徹底斷掉。一秒鐘后,春晚紅包系統(tǒng)被快速切換到另一個機房,海量用戶順利打開了搶紅包頁面。
以上場景,是我虛構(gòu)的。
不過,虛構(gòu)了,但沒完全虛構(gòu)。事實上,這個京東云技術(shù)團隊為春晚項目準備的“超級咒語”,被寫入了京東云春晚技術(shù)團隊的演練劇本當中,在節(jié)前備戰(zhàn)的19天的時間里,演練過多次。
2022春晚項目IDC基礎(chǔ)保障負責人、京東云基礎(chǔ)設(shè)施研發(fā)部高級總監(jiān),負責京東云基礎(chǔ)設(shè)施研發(fā)部高級總監(jiān)常亮,形容這個“咒語”,就像是《哈利波特》里霍格沃茨校長在與伏地魔對決時復活噴泉雕像的那道“咒語”,因為威力巨大,一輩子只能由一個人使用一次。對于京東來說,必須讓每一個極限操作、每一個罕見步驟都被執(zhí)行過一遍,才能在春晚流量洪峰的沖擊下,真正做到系統(tǒng)的萬無一失。
給全國觀眾發(fā)個紅包,需要如此興師動眾、大費周章嗎?
從2014年開始,“在春晚給全國觀眾發(fā)紅包”,就成了互聯(lián)網(wǎng)企業(yè)的競技場,同時也是云廠商練兵的沙場。曾合作過春晚紅包項目的某團隊面對遠超預期的流量,曾發(fā)出過感慨,“我們對春晚的力量一無所知”。
今年的虎年春晚,京東成為央視春晚的技術(shù)合作伙伴。一個歷經(jīng)七年的全民項目,與一個多年備戰(zhàn)6·18和雙11、服務超過5.5億消費者的經(jīng)驗豐富的平臺,合作成功似乎是毫無懸念的。但事情,并沒有這么簡單。
這次央視春晚與京東的合作,給“搶紅包”這個常規(guī)互動,帶來了不少新年新氣象:除了常規(guī)的搶紅包、搖紅包環(huán)節(jié),京東“春節(jié)也送貨”的配送活動依然保留。
線上線下的聯(lián)動讓疫情防控期間的虎年春晚,既保留著紅包和年味,還依然能買到并收到需要的物資。當然,雙重流量的疊加,是一次前所未有的挑戰(zhàn),也給虎年春晚帶來了一些懸念。
對于云廠商來說,春晚紅包互動猶如一場年輕人頗為喜歡的游戲——“劇本殺”。諸多業(yè)務方都希望參與其中,帶來了大量不確定因素,搞不清楚哪一輪就有用戶體驗被“干掉”了。而云廠商所扮演的角色,就是引導全局、撥開迷霧的DM(主持人),通過控場來保證場內(nèi)玩家的游戲體驗,享受春晚互動的樂趣和年味。
經(jīng)過除夕的考驗,京東云做到了“carry全場”,名副其實順利護航了虎年春晚,成功實現(xiàn)“開門紅”。數(shù)據(jù)顯示,全球華人參與京東APP紅包累計互動量達691億次,京東云混合多云操作系統(tǒng)云艦成功挑戰(zhàn)全球最大規(guī)模流量洪峰,在不增加計算資源的情況下,超10000名技術(shù)人員基于京東云行云研發(fā)效能平臺協(xié)同作戰(zhàn),利用遍布全國的70多座數(shù)據(jù)中心,通過史上最短僅僅19天技術(shù)備戰(zhàn)時間,為春晚紅包互動活動快速搭建一套超高彈性、高效敏捷的數(shù)字底座。
這輪大型云上的“劇本殺”,京東云到底是如何闖關(guān)的?前面提到的“劇本”,究竟有沒有被真正操作?這樣絲滑的體驗,又能否從春晚帶到千家萬戶、千行百業(yè)的數(shù)智化“劇目”當中?
虎年春晚“四宗最”:誰是影響用戶體驗的“潛在嫌疑人”?
大過年的,誰讓尊貴的觀眾老爺們不痛快,絕對是要被吐槽上熱搜“祭天”的。用戶體驗的嚴苛要求,即便是經(jīng)歷過多次6·18、雙11等超高并發(fā)復雜場景錘煉的互聯(lián)網(wǎng)巨頭們,也必須嚴陣以待。更何況今年京東云技術(shù)團隊拿到的春晚紅包任務,還增加了許多特殊條件,有四大要素,可能會成為影響虎年春晚紅包體驗的“潛在嫌疑人”:
1.籌備時間。央視春晚作為一年一度最受關(guān)注的全國性晚會,紅包互動也吸引了全球華人的參與,以往各家合作伙伴都需要數(shù)月時間來準備。而京東從1月5日官宣成為2022年中央廣播電視總臺春晚獨家互動合作伙伴,到1月24日春晚紅包互動預約活動開啟,備戰(zhàn)時間只有19天,是歷年央視春晚紅包互動中籌備期最短的一次。
2.活動周期。更為“雪上加霜”的是,虎年春晚互動活動的周期卻是史上最長的,除夕當天京東上線“擊鼓迎春”活動,邀全民共同分紅包和好物,將從臘月二十二(1月24日)一直持續(xù)到正月十五(2月15日)。相比往年除夕玩一把就走的流量沖擊,京東云需要抗住23天的持續(xù)脈沖式流量洪峰,超長周期對數(shù)據(jù)中心資源、系統(tǒng)架構(gòu)穩(wěn)定性、業(yè)務系統(tǒng)伸縮調(diào)配能力等都形成極大考驗。
3.規(guī)模容量。歷屆春晚紅包互動的峰值都在數(shù)億級別,2021年春晚累計紅包互動高達700多億次,是目前全球規(guī)模最大的網(wǎng)絡互動活動。而今年由于疫情的原因,很多人可能不在家人身邊,同看春晚成為分享年味的一種娛樂活動,預計流量還將進一步增加。而數(shù)十秒內(nèi),數(shù)百億人次參與互動點擊,會形成數(shù)億級別的QPS流量洪峰,讓服務器處理數(shù)據(jù)的壓力激增。用戶的訪問行為也不同于6·18、雙11等大促,春晚7輪口播會帶來7輪訪問峰值,對系統(tǒng)穩(wěn)定性、電力持續(xù)供應等都是非常大的挑戰(zhàn)。
(京東云為春晚互動保駕護航〈數(shù)據(jù)截至除夕當晚23:00〉)
4.復雜程度。如前所說,以往的春晚紅包互動都是派發(fā)現(xiàn)金紅包,而虎年春晚京東云除了支撐春晚紅包互動的復雜場景,還需要支撐京東“年貨春運”的線下履約,在豐富用戶體驗感的同時,也給各種業(yè)務系統(tǒng)帶來了壓力。電商供應鏈履約的特征是鏈路很長,需要統(tǒng)籌前端網(wǎng)站、訂單、結(jié)算、支付、搜索、推薦,以及后端的倉儲、配送、客服、售后等各環(huán)節(jié),每一個鏈路節(jié)點的不穩(wěn)定,都將指數(shù)級地放大技術(shù)難度。要讓全國30個省份、超過300個城市、近1500個區(qū)縣的消費者,即使是在除夕、大年初一,也可以正常下單收貨,享受京東小哥送貨上門的春節(jié)物流服務,意味著多個系統(tǒng)的實時同步運算,需要在秒級完成大規(guī)模、高密度、高精準的資源調(diào)度,此時安全及穩(wěn)定的云服務底座就顯得至關(guān)重要。
(除夕當晚,貴州省畢節(jié)市的李女士收到京東快遞送來的春晚第一單實物獎品)
正是因為春晚合作這一“副本”的難度太高,才有了坊間傳聞,互聯(lián)網(wǎng)產(chǎn)品日活得過億才能上春晚,否則,廣告出來的那一瞬間服務器就會崩潰掉。這也是為什么春晚紅包互動的合作伙伴一直是久經(jīng)沙場的互聯(lián)網(wǎng)公司。
那么,今年京東云作為春晚項目的技術(shù)底座,為了保證大家紅包搶得盡興、收貨收得開心,都做了哪些工作呢?
三輪闖關(guān):京東云的春晚三部曲
玩過“劇本殺”的都知道,還原真相需要經(jīng)過數(shù)輪討論、搜證、層層抽絲剝繭。而在春晚項目中,京東云也經(jīng)歷了三輪闖關(guān)。
第一輪:速度關(guān)。
要支撐復雜而規(guī)模龐大的春晚項目,需要快速地構(gòu)建起底層基礎(chǔ)設(shè)施。此時,京東應對復雜業(yè)務場景的豐富經(jīng)驗,以及京東云積木化IT思維,支撐起了備戰(zhàn)體系架構(gòu)的中國速度。
首先,基于歷屆6·18和雙11的經(jīng)驗,進一步優(yōu)化基礎(chǔ)設(shè)施。在支撐電商大促“黃金流程”的歷練中,京東云的系統(tǒng)穩(wěn)定性能夠達到4個9以上。而在春晚到來之前,京東云的技術(shù)團隊又進一步把所有服務器故障全部清零,消除歷史積壓問題,確保服務器處在一個健康的原點;同時,重置了所有在線交換機,即使系統(tǒng)遭遇數(shù)倍于雙十一的流量,交換機群依然可用,保證系統(tǒng)穩(wěn)定。
其次,利用沉淀下來的技術(shù)中臺,實現(xiàn)紅包系統(tǒng)的積木式搭建。作為京東歷年大促核心的基礎(chǔ)設(shè)施服務,京東云的中間件技術(shù)承接了一次次流量洪峰,幫助業(yè)務快速處理用戶的請求。而這些能力沉淀在技術(shù)中臺中,面對春晚紅包等新的項目需求,不需要從0到1去搭建,如同積木一樣快速組合起來,才高效完成了19天構(gòu)建底層系統(tǒng)的任務。
第二輪:質(zhì)量關(guān)。
京東云的幾個技術(shù)人員都表示,剛剛接到這個任務的時候,第一反應是:又可以搞事了,激動!
(京東云產(chǎn)品研發(fā)部工程師討論春晚項目)
要知道,在春節(jié)這樣的喜慶日子,如果搶紅包遇到延遲、白頁、404、客服占線……毫無疑問會讓觀眾更加感到失落??梢哉f,春晚項目對用戶體驗的嚴苛、系統(tǒng)運行的穩(wěn)定,都提出了高質(zhì)量的要求。而面對如此高難度的挑戰(zhàn),京東人的激動,正源自對京東云基礎(chǔ)設(shè)施的自信,以及對技術(shù)能力不斷突破的追求。
如何錘煉高質(zhì)量的保障體系呢?京東云將其拆解為兩種關(guān)鍵能力:
一是“人算”,將人力可控范圍內(nèi)的所有能力做到極致。
基于京東體系多年積累的混沌工程能力,京東云沉淀出穩(wěn)定性主動管理系統(tǒng)——云泰,可以模擬演練可能發(fā)生的一切故障,比如機房斷電、宕機等突發(fā)事故,或者服務器崩潰、硬盤故障、網(wǎng)絡連接斷開等等破壞性事故,通過穩(wěn)定性主動測算、故障注入與演練、全鏈路壓測、紅藍對抗等能力,能夠及早地發(fā)現(xiàn)系統(tǒng)問題,防患于未然。
二是“天算”,為不可預知的意外事件做好充分而扎實的預案。既然是“天算”,就意味著未知,京東針對可能出現(xiàn)的意外情況,為春晚項目首創(chuàng)了“應急劇本”作為異常演練預案。京東云為各個業(yè)務線、上千個系統(tǒng)都設(shè)計了相關(guān)劇本,比如開篇提到的斷網(wǎng)演練劇本,提前設(shè)計好什么場景、誰做什么、多長時間恢復,在一次次實操演練中將預案反復操作,最后在春晚當天才能夠做到面對突發(fā)狀況能夠第一時間找到對應的負責人執(zhí)行。
正是因為京東云在技術(shù)領(lǐng)域執(zhí)著深入,培養(yǎng)出一大批“長跑選手”,在日復一日不間斷的技術(shù)練兵中,最終保障了春晚全國觀眾的體驗,也展現(xiàn)出了數(shù)字時代的中國工匠精神。
第三輪:騰挪關(guān)。
中國有句古話,叫“一力降十會”,意思是在面對一些高難度挑戰(zhàn)時強調(diào)增加資源總量和絕對力量。比如此前的春晚紅包活動中,合作方就臨時擴容或購置了很多新增的服務器,來應對暴漲的流量。但這種“堆資源”的模式,卻不再適用于當下。一方面,專門為春晚購置超出常規(guī)需求的服務器資源,平時又用不到,會導致不必要的浪費;同時,也與國家的雙碳戰(zhàn)略、節(jié)能減排計劃相左。
但資源不足,意味著許多業(yè)務系統(tǒng)承接不住流量洪峰的沖擊。如何在資源零增加的基礎(chǔ)上,保證系統(tǒng)的穩(wěn)定運行,把用戶體驗做到極致呢?
首先,京東云本身就建立在云原生架構(gòu)上,運營著全世界最大規(guī)模的Docker集群、Kubernetes集群,以及最復雜的Vitess集群之一。全面的云原生化,讓京東云可以快速適應不同地域、不同設(shè)備的部署環(huán)境,實現(xiàn)資源快速靈活平滑擴容,從容平穩(wěn)地應對大規(guī)模復雜流量場景的挑戰(zhàn)。
其次,所有底層業(yè)務容器都跑在京東云的混合多云操作系統(tǒng)云艦上,進行靈活實時的統(tǒng)一資源調(diào)度。云艦內(nèi)嵌的智能調(diào)度系統(tǒng),通過人工智能算法,對應用的資源使用情況進行預測,彈性地對資源進行優(yōu)化,將算力優(yōu)先調(diào)度給高算力、高主頻的業(yè)務中。
比如在春晚互動環(huán)節(jié)中,紅包互動系統(tǒng)就為S級,紅包互動、優(yōu)惠券發(fā)放等與流量峰值相關(guān)的任務,會得到盡量多的資源使用機會。
春晚項目中,云艦系統(tǒng)通過算力調(diào)度騰挪整合,做到了“更少資源辦大事兒”。在央視春晚7輪紅包互動中,京東云實現(xiàn)了春晚互動模式與“年貨春運”模式之間16次無縫切換,護航用戶流暢紅包互動的同時暢享年貨云上購物體驗。
(除夕當天參與一線值守的京東云技術(shù)人員歡慶圓滿完成任務)
對于這一結(jié)果,京東云的技術(shù)人員在自豪的同時,也開玩笑說,這怕不是打開了“潘多拉盒子”,連春晚都能扛住,以后不會遇到啥活動領(lǐng)導都不讓買資源了吧。
也正是因為這樣對資源管理“錙銖必較”的精細化管理和技術(shù)創(chuàng)新之中,才能以更少的人力、更少的資源做科學的備戰(zhàn)。
隨著春晚紅包互動進入第7個年頭,從以往靠增加服務器資源備戰(zhàn),到更敏捷高效的資源騰挪,這代表了云廠商技術(shù)能力的進步,展現(xiàn)了云廠商的技術(shù)領(lǐng)先性和成熟度,同時也在助力綠色中國。
19天備戰(zhàn),春晚史上最長的紅包互動,秒級超大規(guī)模的資源切換,上萬研發(fā)工程師高效協(xié)同,資源零增加的情況下獨自支持春晚……京東云的三輪闖關(guān),也是數(shù)字經(jīng)濟背景下,中國速度、中國質(zhì)量、綠色中國的縮影。
辭舊迎新:普羅大眾與千行百業(yè)的同一個“劇本”
從服務產(chǎn)業(yè),到觸達普羅大眾;從堆疊資源,到追求高效敏捷;從畢其功于一役,到備戰(zhàn)常態(tài)化;從爽一把就走的消費互聯(lián)網(wǎng)式玩法,到深耕創(chuàng)新、賦能實體經(jīng)濟的產(chǎn)業(yè)級玩法……虎年春晚背后的京東云,也代表了數(shù)字經(jīng)濟的演變方向,云市場的發(fā)展趨勢。
《中國數(shù)字經(jīng)濟前沿(2021):數(shù)字經(jīng)濟測度及“十四五”發(fā)展》中提到,與傳統(tǒng)經(jīng)濟相比,數(shù)字經(jīng)濟的創(chuàng)新邏輯是:
首先,工業(yè)經(jīng)濟規(guī)模的擴大和服務業(yè)復雜性的增加提出需求,數(shù)字化技術(shù)進步與這種需求相結(jié)合形成新一代IT的分層模塊化結(jié)構(gòu),即新的數(shù)字基礎(chǔ)設(shè)施;其次,新一代數(shù)字基礎(chǔ)設(shè)施推動組織內(nèi)的適應性變化,即流程和業(yè)務邏輯的變革;最后,數(shù)字經(jīng)濟的創(chuàng)新力通過產(chǎn)品、資產(chǎn)等創(chuàng)新表現(xiàn)出來。
不難發(fā)現(xiàn),數(shù)字經(jīng)濟源于普羅大眾的真實需求,也源于傳統(tǒng)經(jīng)濟的升級渴盼。B端的千行百業(yè),與C端的千家萬戶,都在讀著同一個時代的“云劇本”。
如果說此前春晚背后的云廠商,是希望借力春晚流量的高性價比,來普及線上業(yè)務和“上云”價值,那么在新的劇本中,云廠商的能力體系也必須與時俱進。
一方面,從簡單的“上云”,要“用好云”,提升基礎(chǔ)設(shè)施的效能。與消費市場相比,千行百業(yè)的數(shù)智化轉(zhuǎn)型,對云廠商提出了更多的要求:要將產(chǎn)業(yè)問題轉(zhuǎn)化為技術(shù)可解的問題,讓前沿技術(shù)真正落地;成本敏感,要能夠盡可能降低上云用數(shù)賦智的風險和投入,提供豐富可復用的行業(yè)方案與工具;注重長期有效,需要一絲不茍、精益求精的執(zhí)行團隊……這些恰恰都是京東云能夠在春晚項目中carry全場的關(guān)鍵要素。
同時,春晚流量不應該只為互聯(lián)網(wǎng)企業(yè)的業(yè)務拉新,還要兼顧社會效益和產(chǎn)業(yè)價值,帶動實體經(jīng)濟的共同繁榮,云廠商也需要擔負起助力數(shù)字產(chǎn)品和服務創(chuàng)新的使命。
以“更懂產(chǎn)業(yè)”的京東云為例,除了支撐春晚紅包互動之外,還攜手更多實體企業(yè)在春節(jié)期間繼續(xù)實現(xiàn)高質(zhì)量增長。比如電商業(yè)務背后的數(shù)十萬品牌商家,以及跟各個運營商溝通協(xié)作確保機房、網(wǎng)絡、專線的7×24響應。
正是這些來自諸多行業(yè)的面孔,才共同構(gòu)成了一個圓滿的虎年春晚。
此前,我們更多地看到的是一個在產(chǎn)業(yè)中如有神助、增長迅猛的京東云。Gartner2020年全球云計算IaaS市場追蹤數(shù)據(jù)曾顯示,京東云IaaS市場占有率排名中國第五,在頭部廠商中增速排名前三,躋身國內(nèi)云計算第一梯隊。
從京東內(nèi)部到服務產(chǎn)業(yè),再從春晚舞臺走向普羅大眾,京東云持續(xù)夯實數(shù)智化社會供應鏈的數(shù)字底座、打造新一代云產(chǎn)融合的供應鏈體系,既是技術(shù)上的“三級跳”,也給業(yè)務發(fā)展帶來了源源不斷的增長動能??梢钥隙ǖ氖?,經(jīng)此一役,跑出產(chǎn)業(yè)數(shù)字化“加速度”的京東云,也將坐穩(wěn)云廠商頭部陣營的位置。
一年一度的春晚,如同一扇窗口,我們總能看到很多,政策、民生、年度熱詞、來年展望……而虎年春晚,京東云的“劇本殺”,讓我們一窺云服務從互聯(lián)網(wǎng)到數(shù)實融合的歷程、從“上云”到“用好云”的深化、從量變到質(zhì)變的躍遷。
不須迎向東郊去,春在千門萬戶中。
-
工程師
+關(guān)注
關(guān)注
59文章
1569瀏覽量
68501 -
云計算
+關(guān)注
關(guān)注
39文章
7774瀏覽量
137351 -
互聯(lián)網(wǎng)
+關(guān)注
關(guān)注
54文章
11148瀏覽量
103224 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
4761瀏覽量
72034 -
京東
+關(guān)注
關(guān)注
2文章
998瀏覽量
48473 -
京東云
+關(guān)注
關(guān)注
0文章
102瀏覽量
40
發(fā)布評論請先 登錄
相關(guān)推薦
評論