訂閱
糾錯
加入自媒體

數據科學平臺,Cool!但并不孤獨

2020-04-10 16:02
云報
關注

一提到“數據科學家”,都覺得這是一項很酷的職業(yè);而一說到“數據科學”,雖然僅僅一字之差,卻讓人心生敬畏,感覺有些晦澀甚至是距離感。但是,偏偏有這樣一家中國的數據科學平臺提供商成了Gartner發(fā)布的“Cool Vendors in AI for Fintech in Asia/Pacific”報告中備受推崇的一家“酷公司”,而且是中國大陸地區(qū)唯一入選的企業(yè),它就是九章云極。

九章云極身上的“酷元素”

生活中,我們形容一個人酷,可能是因為他標新立異的穿著打扮、特立獨行的做事風格,又或是冷冷的帶一絲傲嬌的氣質。九章云極的“酷”究竟表現在哪里呢?

九章云極這個名字本身就透露著一股文藝范兒,極富中國韻味,再細細品味,九章就是九章算法,云極便是云計算與極=,獨特的專業(yè)韻味此為一酷。九章云極DataCanvas數據科學平臺產品的吉祥物是一只可愛的花栗鼠,叫做“八斗”,有才高八斗之意,這聽起來也挺酷。九章云極為不同的客戶人群提供各種智能化的業(yè)務場景,比如信貸資格的審查、預測事故風險、人群分布預警等,諸如此類的智能化應用是不是也挺酷?

數據科學平臺是一條逐漸升溫的新賽道。以前,人們對數據科學平臺的概念認知不清,想酷也酷不起來。2017年,Gartner給出了數據科學平臺的明確定義, 提出了數據科學平臺不可或缺的四大要素:“數據、算法、數據科學家、業(yè)務價值”。

數據科學平臺,Cool!但并不孤獨

九章云極聯合創(chuàng)始人兼CEO方磊

“相比以往,企業(yè)客戶對數據科學平臺的理解確實更加深入。面向具體的業(yè)務場景,在數據的基礎上加載算法,解決企業(yè)的實際業(yè)務問題,這才是數據科學平臺的真正價值所在!本耪略茦O聯合創(chuàng)始人兼CEO方磊指出,“專注于數據科學平臺這條賽道,我們引領未來的發(fā)展方向。DataCanvas數據科學平臺形成了獨有的“四庫”方法論,深入而靈活地應用機器學習、深度學習算法,為各行各業(yè)的客戶帶來新的價值。這可能是Gartner最看重的我們身上的‘酷’元素吧。”

從簡化應用到提升價值

“用數據解決業(yè)務問題,都屬于數據科學的范疇。”方磊一語中的。

很多時候,我們容易將數據科學與BI(商業(yè)智能)混淆。其實,BI的主要工作是數據的歸類和展示,不涉及算法,旨在讓人幫助人更好地理解業(yè)務,并間接地解決業(yè)務問題。數據科學的不同之處在于,它以算法為核心,直接解決業(yè)務問題。舉個例子,在處理車險理賠時通常需要上傳一些相關照片,然而有人會別有用心地上傳PS后的照片。面對這種情況,BI只是匯總最后的統(tǒng)計數據,告訴你歷史上出現過多少次這種造假行為,而數據科學平臺則在照片上傳時,通過算法和分析,直接指出哪些照片是PS過的!癇I最終還是要依賴人進行分析,而數據科學平臺通過在數據上加載算法,在具體的業(yè)務場景中實現閉環(huán),并以自動化的方式解決業(yè)務問題!狈嚼诮忉屨f。

數據科學平臺,Cool!但并不孤獨

DataCanvas數據科學平臺

大數據、人工智能等應用剛興起時,因為業(yè)務場景、技術實現上的復雜性,所以無論是廠商還是企業(yè)用戶,都將降低應用門檻作為突破口。這是數據科學平臺從0到1的演進過程,這項工作九章云極做了四五年,并掙得了第一桶金。在應用壁壘降低到一定程度后,積累了大量專業(yè)技術人員,以前可能只有數據科學家能完成的工作,現在具備一定技術能力的人也可以完成,生態(tài)發(fā)展被提上了議事日程,數據科學平臺的發(fā)展也過渡到從1到100的躍升階段。在這個階段,就要針對具體的業(yè)務場景,依靠算法,提升解決業(yè)務問題的能力,創(chuàng)造新的價值。正是在這樣的背景下,2019年初,九章云極創(chuàng)新性地提出了DataCanvas“四庫”——模型倉庫、特征倉庫、模版?zhèn)}庫和AutoML Recipe倉庫的技術組合,可以有效解決行業(yè)AI建設的三大難題,包括經驗及業(yè)務知識融合、模型資產共享和臺運維管理,以及場景化知識遷移。

“四庫”是九章云極歸納出的一套方法論,它將行業(yè)經驗、業(yè)務知識和數據科學技術有效結合,直接降低客戶對資源的依賴和AI建設的成本。方磊表示,數據科學平臺落地的一個核心是場景模板化,這樣才能在客戶中快速復制和交換共享。如果能把九章云極的“四庫”方法論變成行業(yè)標準,無疑將加速這一進程;凇八膸臁,DataCanvas未來還會有重大的版本升級。

“在不同的發(fā)展階段,需要解決的主要矛盾也不同。從0到1的階段,要實現簡化,而在從1到100的階段,產生價值才是最重要的,這就要求模型更準。為此,必須將業(yè)務的Know-How加入進來!狈嚼谝孕∥⑵髽I(yè)信貸分析為例,其模型非常復雜,但仍有大量信貸知識不在模型中,比如隱形負債因素等,而這些知識和業(yè)務Know-How很多就來自人的經驗和積累,只有將它們融入模型,才能讓模型更準確,從而更好地挖掘業(yè)務價值。

通向AI的主流路徑

按照傳統(tǒng)的廠商分類方法,九章云極會被歸到大數據廠商陣營。但是最近兩年,人工智能成了九章云極的一個新標簽。比如,Gartner的“Cool Vendors in AI for Fintech in Asia/Pacific”報告,主要研究的對象是亞太地區(qū)將AI增強創(chuàng)新成功商用在金融科技領域的新興企業(yè),九章云極之所以能夠入圍,就是因為它在金融領域AI應用方面具有很強的創(chuàng)新能力。再比如,在IDC發(fā)布的《IDC MarketScape:中國機器學習開發(fā)平臺廠商評估》研究報告中,九章云極也位于主要廠商位置。

“AI的定義十分寬泛,機器學習、深度學習都屬于AI的范疇。但是AI也分成多個學派,比如其中的符號學派,不借助數據,僅憑符號就能推導出結果!痹诜嚼诳磥恚珹I是一種狀態(tài)、一個目標,而數據科學是達到這一目標的主流方式和路徑。

與很多AI應用類廠商不同,九章云極是一個平臺廠商。從2014年開始推出產品,經歷了公有云、私有云等不同的交付方式,九章云極在AI應用方面的差異化定位更加清晰。通常來說,數據處理要經過四個主要環(huán)節(jié),先建立數據倉庫,然后進行數據治理,接下來實現商業(yè)智能,最后是借助訓練出的模型,自動化地解決業(yè)務問題。相關廠商也按照這四個部分進行分類、匯聚。九章云極就處于整個數據價值鏈條的最后端,也是實現價值的關鍵。

Gartner從2017年起才將數據科學平臺作為專門的研究領域,在此之前,九章云極執(zhí)著地走過了一段孤獨的路程。但是,方磊并不認為數據科學平臺是一條孤獨的賽道。在國外,數據科學早就形成了一個成熟的生態(tài),廠商間的并購不斷,估值70億美元的數據科學平臺企業(yè)讓人艷羨。

與國外相比,中國在數據科學領域還有較大差距,主要體現在:美國現有兩三百萬名數據科學家,很多公司都有專門的數據科學團隊,有的還設立了CDO(首席數據官)的職位,但是中國的數據科學家稀缺,人才成了瓶頸;美國的客戶具備較強的技術能力,傾向于在標準化的軟件產品之上自己進行集成和開發(fā),而中國客戶更喜歡端到端的解決方案和服務,有時還需要廠商提供具體的模型,這是生態(tài)和應用不成熟的一種表現。

為了滿足中國客戶的需求,九章云極一方面為大型企業(yè)客戶提供平臺化的產品;另一方面除了為中小企業(yè)客戶提供整體解決方案以外,還提供具體的模型。“我們上不碰企業(yè)的業(yè)務,下不碰企業(yè)的數據,而是專注于提供數據科學平臺和模型!狈嚼诒硎荆皵祿茖W平臺的重心在算法上,而不是簡單地提供數據統(tǒng)計和匯總功能。從數據到業(yè)務,數據科學平臺是中間的橋梁,將逐步深入到各個場景中!

企業(yè)客戶從自己需求的角度看數據科學平臺,會有不同的理解。比如,從業(yè)務的角度,有人認為數據科學平臺就是一個模型工廠;從管理的角度,有人將數據科學平臺當成管理數據科學家的OA,可以更好地將數據科學家組織起來,發(fā)揮其價值。不管如何描述數據科學平臺,各行業(yè)已經達成了一個基本共識:借助數據科學平臺,可以找到業(yè)務的價值點。

從“酷”到主流

在數據科學平臺的賽道上,九章云極是不是要跑得再快一些?方磊認為:“to B類型的企業(yè)還是要依靠積累效應。2019年,我們完成了新一輪融資,并且連續(xù)保持年增長100%。未來,我們仍將按照自己的節(jié)奏發(fā)展!

不僅數據科學家這一職業(yè)酷,數據科學這項事業(yè)更酷,他們都是為了智能世界的明天更加美好。但在方磊看來,什么時候人們不再談論數據科學、數據科學家酷不酷這個話題,就說明數據科學已經成了主流,被各行各業(yè)的用戶所接納,以九章云極為代表的數據科學平臺廠商的好日子才算是真正到來。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號