高客戶滿意度是BoryNet不斷追求的目标。
691 2021-09-07
通(tōng)過這一開源平台,世界各地的開發者們可(kě)以免費獲得更優質和(hé)更容易使用的分布式機器(qì)學習算法源碼,從而大幅降低開發和(hé)部署分布式機器(qì)學習系統及相關(guān)應用的門檻。包括今日頭條、汽車(chē)之家等在内的多家公司已經通(tōng)過該開放平台受益。

作為在人工智能布局較早的玩家,百度擁有領先業(yè)界的實力。從2013年百度深度學習研究院(IDL)的創建及2014年Andrew Ng的加盟至今,百度DMLC分布式深度機器(qì)學習開源項目(簡稱“深盟”)已在深度學習的多個(gè)應用領域做過探索,上線了如(rú)xgboost(速度快效果好的Boosting模型)、CXXNET(極緻的C++深度學習庫)、Minerva(高效靈活的并行深度學習引擎)以及Parameter Server(一小時訓練600T數據)等産品,在語音識别、OCR識别、人臉識别以及計算效率提升上發布了多個(gè)成熟産品。

而具有一系列領先優勢的百度卻選擇開源其深度機器(qì)學習平台,為何交底自己的核心技術(shù)?

深思之下(xià),卻是在面對業(yè)界無奈時的遠(yuǎn)見之舉。

擁抱世界:開源的魅力

開源,顧名思義,就是開放自己的源代碼給别人查閱和(hé)使用,盡管看起來很傻,然而諸多曆史事實卻告訴我們擁抱世界也能讓世界擁抱你(nǐ)。

Android的逆襲就是明證,在iOS侵占絕大多數智能手機操作系統的時代誕生,Google選擇開源,讓早已在蘋果面前沒有機會的業(yè)界見到了希望,至今Android已擁有過半的市場份額,以至于在移動(dòng)互聯網大行其道的今天,Google可(kě)以憑借它與旗下(xià)産品的整合打造屬于自己的強大生态系統。相比之下(xià),生而嬌貴的Windows mobile的故事夠令人發醒的,終于微軟也不得不寄人籬下(xià)地去兼容Android和(hé)iOS平台應用。此外,作為微軟最主要的應用程序框架,微軟對.net寄予厚望,希望它的開源可(kě)以來到所有平台,進而重現JAVA的光輝曆史。這也證明了即使強大如(rú)微軟也無法憑借一己之力讓其産品得到世界的擁抱。

衆人拾材火焰高:用平台籠絡世界的力量

要實現人工智能,機器(qì)必須具備自主學習能力,深度學習作為機器(qì)學習領域的重大突破,可(kě)以完成具有高度抽象特征的人工智能任務,如(rú)自然語言理解等複雜場景,因而備受業(yè)界追捧。當然,機器(qì)學習領域并不隻是有深度學習這一種算法的存在,然而深度學習卻有着顯著的優勢:在數據集足夠大的情況下(xià),深度學習擁有最好的預測能力。盡管在算法的選擇上仍然存在“殺雞焉用宰牛刀”的争論,但深度學習算法為人工智能領域注入的強大能力卻是其他算法無以比拟的;同時,随着深度學習技術(shù)的成熟,諸多傳統機器(qì)學習算法的淘汰幾乎是必然的。然而正如(rú)前述,深度學習對大量數據的需求及其本身的複雜性仍然是其發展壯大路(lù)上的最大阻礙,也是業(yè)界的無奈所在。

百度在此領域發力較早,且在諸多方向上進行了深入的研究,利用深入學習結合自身搜索引擎的大數據讓機器(qì)翻譯及自然語言等技術(shù)實現了新的飛躍。然而在面向更廣大更具體的應用場景時,任何一個(gè)公司都難以滿足所有需求。借鑒曆史,開放共赢不僅可(kě)以把事情做的,也讓業(yè)界和(hé)生态系統得到健康發展。

百度此次開源也是完全奔着建平台去的。完全采用C++語言搭建核心,為平台的穩定高效運行奠定了基礎;覆蓋了三類最常用的機器(qì)學習算法,包括用于點擊預測的稀疏線性模型、用于排序的決策樹(shù)模型以及深入學習,滿足了最廣大的需求;重點開發的“蟲洞”項目将自動(dòng)構建深盟所有項目,為所有組件提供一緻的數據流支持且提供包括Amazon EC2,Microsoft Azure, Google Compute Engine在内的雲計算平台兼容支持,降低平台的準入門檻。

開源并入駐Github也進一步強調了其開放的心态和(hé)對平台的信心。一系列的動(dòng)作都是希望讓開發者可(kě)以獲得更優質更容易使用的深入學習算法源碼,降低開發和(hé)部署深入學習系統及相關(guān)應用的門檻,進而利用世界的力量壯大自身。

面對可(kě)預料的爆發,技術(shù)一定程度上漸發成熟,但也因為各自的技術(shù)基因和(hé)路(lù)線差異,面臨着極大的分裂傾向。開放的心态擁抱世界,打造機器(qì)學習領域的國際标準,百度的此舉既是對前期研究投入的回收保障,更是攜手籠絡友商(shāng),确保自身的話語權所在。