數(shù)據(jù)科學家的福利:谷歌云正在推動模型共享
當?shù)貢r間11月9日,谷歌云宣布推出兩款工具:Kubeflow Pipelines和AI Hub,旨在幫助數(shù)據(jù)科學家能在不同組織之間利用所創(chuàng)建的模型進行工作。
谷歌云AI和ML(機器學習)產(chǎn)品總監(jiān)Rajen Sheth表示,公司意識有很多數(shù)據(jù)科學家所創(chuàng)建的模型從來沒有被使用過,如果ML真的像谷歌相信的那樣是一場團隊運動,那么模型應該是能夠共享的,數(shù)據(jù)科學家、數(shù)據(jù)工程師和開發(fā)者都應該能夠基于這些模型構(gòu)建應用程序。
為了幫助解決這個問題,谷歌宣布推出Kubeflow的擴展框架Kubeflow Pipelines,一個構(gòu)建在Kubernetes之上并專為ML服務的開源框架。Pipelines(管道)本質(zhì)上是容器化的組件,ML生態(tài)系統(tǒng)中的用戶可以將這些組件連在一起來構(gòu)建和管理ML工作流程。
通過將模型內(nèi)置到容器中,數(shù)據(jù)科學家可以簡單地根據(jù)需要調(diào)整并用持續(xù)交付的方法重新啟動底層模型,Sheth認為這為公司提供了更多模型使用的可能性。
至于ML特征,Kubeflow Pipelines還為客戶提供了一種新的方式,通過試驗不同的管道變體,識別出哪一種能在可靠和可重復的環(huán)境中輸出最佳效果。
AI Hub,顧名思義,數(shù)據(jù)科學家可以在這個Hub(中心)找到各種不同的ML內(nèi)容,包括Kubeflow pipelines、Jupyter notebooks、TensorFlow模塊等。AI Hub將是一個公共存儲庫,涵蓋谷歌云AI團隊、谷歌研究院以及其他谷歌團隊所開發(fā)的資源,允許數(shù)據(jù)科學家利用谷歌自家研發(fā)的專門知識。
但是谷歌希望這個Hub不僅僅是一個公共資源庫,還是一個允許組織內(nèi)部私下共享信息的平臺,因此賦予它雙重的用途。數(shù)據(jù)科學家可以借此輕易使用中央儲存庫的必要組件,而模型的使用率也相應得到提升。
該AI Hub即日起在Alpha平臺上線,谷歌已經(jīng)提供了一些初始組件和分享內(nèi)部資源的工具,往后也將繼續(xù)提供更多的資源和性能。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字