作業(yè)幫受邀參加2020中國教育科技大會,基礎架構負責人分享多云架構新探索
12月23日,由中國計算機用戶協(xié)會指導,iTechClub(互聯(lián)網(wǎng)技術精英俱樂部)教育委員會主辦的國內互聯(lián)網(wǎng)技術領域最專業(yè)、最具影響力的大型教育科技類行業(yè)盛會“2020中國教育科技大會”在北京召開。
作業(yè)幫基礎架構負責人董曉聰受邀出席本次大會,并在“運維安全——后疫情時代的在線教育挑戰(zhàn)”分會場分享作業(yè)幫如何通過基于云原生的多云建設,破解業(yè)務發(fā)展過程中存在的穩(wěn)定性、效率、成本、安全等方面問題,實現(xiàn)彈性、韌性、可觀測、自動化、可持續(xù)的在線架構,以及通過技術改造帶來的一系列收益,以真實案例深刻闡述技術變革持續(xù)推動教育產業(yè)的加速迭代發(fā)展。
以業(yè)務為導向,深入布局基于云原生的多云建設
本屆大會以“新業(yè)態(tài)·新動能·新教育”為主題,互聯(lián)網(wǎng)教育科技領域的眾多專家學者、技術大咖在現(xiàn)場圍繞中國教育科技的現(xiàn)狀、發(fā)展、創(chuàng)新、變革、機遇等多方面問題展開深度剖析。作業(yè)幫作為通過充分運用新技術不斷推動教育產業(yè)優(yōu)化升級的領先代表,其在云原生、多云架構領域的新思考、新布局在大會現(xiàn)場受到各界高度關注。
目前,作業(yè)幫的核心業(yè)務主要包括作業(yè)幫主APP、作業(yè)幫直播課、作業(yè)幫口算、鴨鴨AI課、智能硬件喵喵機等多款教育產品。其中,作業(yè)幫主APP作為一款為K12學生提供全學段的學習輔導工具,目前月活用戶已過億,題庫超過3億,拍照搜題的圖片識別準確率超過95%;而作業(yè)幫直播課作為一款為K12學生提供全時段在線輔導課程的產品,目前已累計服務學員超6500萬,直播課APP是其學生端,在其后還有龐大的教研、教學、輔導工程體系支撐,作為一款商業(yè)化產品,拉新、轉化、留存相關的營銷體系也是很重要的一環(huán)。
董曉聰在演講中表示,作業(yè)幫既有傳統(tǒng)流量型互聯(lián)網(wǎng)產品,也有教育全鏈條的產業(yè)應用,正是基于企業(yè)業(yè)務的高速發(fā)展現(xiàn)狀,使得作業(yè)幫在穩(wěn)定性、資源成本、人員效率、安全等方面面臨著諸多新挑戰(zhàn)。
“在線教育擺在我們面前不是一個個冷冰冰的UV、PV數(shù)字,而是一個個正在求知的學生,我們的穩(wěn)定性一定要做到更好,所以作業(yè)幫很早就開始探索多云架構!倍瓡月斨赋觯鳂I(yè)幫作為一家以業(yè)務為導向的公司,通過云原生架構,用基礎設施接管業(yè)務中大量非功能邏輯,實現(xiàn)彈性、韌性、可觀測性、自動化、可持續(xù)等特性!盎谠圃軜嫞鉀Q了部署問題,我們還在此之上實現(xiàn)了一套可以在云之間自由遷徙的多云架構!
容器技術部署模式升級,實現(xiàn)應用和資源的解耦
目前,作業(yè)幫云原生架構的全貌從大的層次來看,主要包含資源和應用兩層!疤摍C架構中應用和資源兩層耦合,而容器技術的出現(xiàn)真正實現(xiàn)了兩者的解耦。向下,提供了CRI、CNI、CSI、device plugin等一系列資源抽象能力;向上,實現(xiàn)運行環(huán)境的編排調度!倍瓡月敱硎尽H萜骷夹g帶來的部署模式升級,從根本上解決了虛機模式下的混部、資源碎片多種問題。
作業(yè)幫在運行環(huán)境構建這塊遵循云原生的主線原則。不僅通過每個容器一個應用,避免使用特權容器,優(yōu)化構建緩存等原則,實現(xiàn)了穩(wěn)定、安全、性能方面的要求!拔覀兊淖罴褜嵺`,對于PHP pod而言,有一個PHP主容器,以及通過socket通信的幾個邊車,配置通過configMap注入,數(shù)據(jù)庫密碼信息由secret加密存儲。Golang pod也比較類似,只是不再需要日志等邊車!敝档靡惶岬氖,作業(yè)幫也把前端模塊容器化,這樣可以一鍵拉起前后端項目,大幅提高研發(fā)效率。
此外,從集群視圖來看,在資源拓撲上,對于CPU和異構計算GPU而言,作業(yè)幫使用了常規(guī)流量+彈性部分的架構方案。同時,作業(yè)幫根據(jù)網(wǎng)絡隔離域劃分集群,根據(jù)業(yè)務領域劃分NameSpace。
突破虛機架構弊端,依托云原生升級服務治理體系
在介紹了容器技術的部署、運行環(huán)境、集群等內容后,董曉聰還重點剖析了應用層的服務治理體系,作業(yè)幫在進行了徹底的云原生改造后,其服務注冊發(fā)現(xiàn)機制已更換為coreDNS+service機制。
如何實現(xiàn)新老兩套機制的過渡呢?我們通過將名字服務的信息同步到k8s集群,創(chuàng)建endpoint指向虛機的service,進而實現(xiàn)控制面的打通。
而從數(shù)據(jù)面來看,虛機請求容器通過使用service域名訪問東西向的ingress集群實現(xiàn)。容器集群因為打通了數(shù)據(jù),訪問虛機使用和容器一樣的鏈路即可。
此外,在服務感知維度,作業(yè)幫的整體調用鏈路從用戶端的APP、H5、小程序等,到網(wǎng)關層,再到業(yè)務應用,最后到中間件。我們將這些鏈路的日志統(tǒng)一收集到kafka。目前kafka集群可以支撐近千萬的TPS,峰值平均延時在10s內。除了性能指標外,穩(wěn)定性也是作業(yè)幫的重要考核因素,通過多級緩存來保障數(shù)據(jù)不丟。在收斂了日志采集后,下游只需要訂閱kafka即可,既解決了大數(shù)據(jù)日志源的問題,也解決了Logging、tracing、metrics的相關問題。監(jiān)控不再需要運行在業(yè)務機器上和應用爭搶資源,應用的入向和出向日志也能繪制出調用鏈路。
多云架構賦能在線教育新業(yè)態(tài),四大維度收益明顯
在容器技術解決了計算及其周邊的存儲、網(wǎng)絡的抽象及高可用保障之后,新的挑戰(zhàn)則是如何把多云聯(lián)通起來。傳統(tǒng)互聯(lián)網(wǎng)應用時代,只需要把多個云廠商聯(lián)通,但是在線教育新的業(yè)務形態(tài)下,作業(yè)幫則需要把主講、輔導老師的網(wǎng)絡環(huán)境也納入生產體系。
為此,作業(yè)幫選擇了使用了雙供應商組網(wǎng)方案,采用BGP+ECMP實現(xiàn)線路負載均衡,故障秒級自動切換,由此真正搭建完畢高可用的多云網(wǎng)絡拓撲。
在調用拓撲層面,作業(yè)幫在不同云上部署的均是全量服務,只是流量比例不同,由此實現(xiàn)單云內的流量閉環(huán)。
值得注意的是,作業(yè)幫在今年完成云原生和多云建設后,公司在四大維度的收益明顯。一是穩(wěn)定性顯著提升,不再有應用間的相互影響,單設備故障的影響時長也從分鐘級別縮短到秒級別。SLA從99.95%提升到99.99%。二是運維效率的大幅提高,真正將運維規(guī)范在運行環(huán)境得到了落地,擴容效率從小時級別提升到分鐘級別。三是成本的優(yōu)化,既有運行環(huán)境升級帶來的性能提升,也有碎片的更充分利用,以及不同業(yè)務之間的資源使用互補。四是多云部署效率得到大幅度提高,從之前的月級別縮短到現(xiàn)在的周級別,效率提升80%以上。
在演講最后,董曉聰也對未來提出更多展望,他表示,作業(yè)幫希望在明年和云廠商容器、EMR團隊一起進一步探索更大規(guī)模的在離線混合部署,并基于operate實現(xiàn)中間件服務的云原生改造,借助servicemesh實現(xiàn)跨語言的服務感知、流量管控方案,以及在全鏈路壓測與AIOps上進行更多新探索。

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月23日火熱報名中>> 2025是德科技創(chuàng)新技術峰會
-
10月23日立即報名>> Works With 開發(fā)者大會深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產業(yè)大會
-
9 每日AI全球觀察
- 1 特斯拉工人被故障機器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 AI 時代,阿里云想當“安卓” ,那誰是“蘋果”?
- 4 拐點已至!匯川領跑工控、埃斯頓份額第一、新時達海爾賦能扭虧為盈
- 5 硬剛英偉達!華為發(fā)布全球最強算力超節(jié)點和集群
- 6 隱退4年后,張一鳴久違現(xiàn)身!互聯(lián)網(wǎng)大佬正集體殺回
- 7 00后華裔女生靠兩部AI電影狂賺7.8億人民幣,AI正式進軍好萊塢
- 8 谷歌“香蕉”爆火啟示:國產垂類AI的危機還是轉機?
- 9 機器人9月大事件|3家國產機器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!
- 10 美光:AI Capex瘋投不止,終于要拉起存儲超級周期了?
- 生產部總監(jiān) 廣東省/廣州市
- 資深管理人員 廣東省/江門市
- Regional Sales Manager 廣東省/深圳市
- 銷售總監(jiān) 廣東省/深圳市
- 結構工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 自動化高級工程師 廣東省/深圳市
- 技術專家 廣東省/江門市
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 封裝工程師 北京市/海淀區(qū)