當前位置: 華文問答 > 數碼

主打中文的 AI 模型開源社區魔搭 ModelScope 上線,用過的來說說?會成為國內的主流社區嗎?

2022-11-03數碼

中文領域的「大大大大大」模型,開源開放了!

一口氣10+個大模型聯手登場,能寫詩、寫作文、寫程式碼,還能畫畫、做影片、看圖說話。

戳進主頁,不僅程式碼可下載,Notebook、線上Demo也已就位。

直接就是 線上可玩,開箱即用

煉丹師福音還不止如此。

在這個名為 魔搭ModelScope 的開源社區裏,你甚至可以 1行程式碼就實作模型推理

△一行pipeline完成模型推理

10行程式碼搞定調優訓練(finetune)

不得不說,這波開源有點東西。

如此大手筆,確實也並非哪家研究機構的SOLO,而是由國內AI工業界和學界聯合推動:

阿裏達摩院與CCF開源發展委員會共同發起,首批合作機構包括瀾舟科技、智譜AI、深勢科技、中國科學技術大學、浙江大學等,陣容蔚為壯觀。

更多細節,咱們一起研究研究。

以模型為核心的中文AI開源社區

要說魔搭ModelScope有何不同之處,答案其實就在社區名字裏:以模型為中心,搭建AI套用服務。

因此社區剛成立,就已經有300+模型上線,其中包括10多個大模型和150+ SOTA模型。並且 其中1/3都支持中文

就說最近大火的AI畫畫,在模型居里一搜,就能找到對應的模型。

點進可體驗的通義-文本生成影像大模型,即使你完全是AI小白,也能直接體驗。

比如讓AI生成一張「小雞戴墨鏡唱歌跳舞」的圖片。

結果是這樣的:

還有更潮酷的。

輸入「一張柯基犬在時代廣場騎單車的照片。它戴著墨鏡和沙灘帽」,就能得到:

紅極一時的GPT-3中文復刻版也在魔搭社區上架了,寫起古詩來可謂有模有樣。

在AI for Science方面,「中國版AlphaFold2」——深勢科技的Uni-Fold同樣亮相魔搭。

輸入蛋白質單體的一級結構,就能線上預測蛋白質的三級結構啦。

此外,會寫爽文、 以10億參數輕量化模型登頂CLUE(中文語言理解榜單)的瀾舟科技孟子系列模型 智譜AI同時支持101種語言的預訓練模型 ……都能在魔搭上找到並體驗。

並且正如前文所說,魔搭提供的不僅僅是模型下載和使用,還把環境安裝、推理驗證、訓練調優、模型部署的一站式服務都搭好了。

環境安裝 方面,魔搭支持本地環境快捷安裝,提供了Python whl包安裝和源碼安裝。

同時也支持雲端Notebook免安裝,一鍵就能開啟線上Notebook實訓平台。

模型推理 方面,基於魔搭提供的封裝Python SDK,開發者只寫一行程式碼,就能快速驗證和使用模型。

模型調優 方面,魔搭同樣提供了簡單易用的呼叫介面,以及靈活的配置檔設計,實作了10行程式碼執行一個調優任務。

最後,在 模型部署 上,魔搭支持雲端、本地、器材端等多種部署方式。

值得一提的是,魔搭還給開發者們提供了不少免費算力資源。

其中,8核32G的CPU資源不僅免費,還可無限續杯。

GPU算力方面,則有16小時的免費V100資源可用。並且多貢獻多得。

魔搭社區,為什麽是現在?

那麽,問題來了,這麽多家產業界和學術界研究機構,怎麽就湊到一塊兒搞起新的開源平台來了?

究其根本,其實還是一個AI落地套用,尤其是AI大模型產業化套用的問題。

一方面,我們能看到,AI技術正在各個領域迅猛發展。在頂尖的學界、產業界研究機構裏,AI模型們的更新叠代可謂是日新月異。

但另一方面,AI技術本身的門檻仍然很高。尤其是在大模型上, 以模型為核心 演算法 算力 數據 三位一體的重要性更加突顯。

更不用說,到了具體的套用層面,由於現在的技術仍無法實作「一個模型打天下」,後續還有大量模型調優、二次開發工作要做。

開源無疑是推動AI技術更快走向大眾的神兵利器。

問題是,在今天,盡管GitHub之類的程式碼托管平台已經非常成熟,但各種開源資源實際上還是非常分散,並且往往被框架、渠道等因素所限制。

也就是說,對於更廣大的開發人員來說,現在仍缺少統一的中立社區,能把海量模型、算力、數據高效地匯聚到一處。

就是在這樣的背景之下,達摩院等中國AI玩家們一拍即合,共同攢出了魔搭這麽一個大招。

簡單來說,魔搭社區核心提供的價值就是「 模型即服務(Model as a Service,簡稱MaaS) 」:

開源,並且提供開源之後模型的使用服務

讓普通開發者能更低門檻地把模型跑起來。讓AI,尤其是AI大模型不再是少數人的遊戲。

從這個意義上來說,我們可以將模型分散開源視作AI開源的1.0模式,而魔搭社區則是在探索AI開源2.0時代的新範式。

說到MaaS,其實並非全新概念。

之所以此前並未激起太大水花,與其本身面臨的困難不無關系:

一方面,需要AI技術、優質模型本身的積累達到一定數量。

另一方面,圍繞模型展開服務也就意味著大量資源的排程。

簡而言之,單靠一家公司、一個機構是很難真正做到「模型即服務」的。

因而此中國科研機構們強強聯手,積極貢獻出一大波先進大模型、SOTA模型,屬實不易。

對於本土AI開發者而言,不可謂不是一個好的開始。

阿裏巴巴集團資深副總裁、達摩院副院長周靖人還透露,接下來,魔搭社區還會每月上新,達摩院將長期支持社區的維護和發展。

AI時代的新型基礎設施

如果將AI技術帶來的變革視作第四次工業革命,那麽AI技術的落地,終將從依賴專家調參的手工作坊時代,走向工業化大生產時代。

在這其中, 預訓練模型 就是關鍵所在。

中國電腦學會副理事長、瀾舟科技創始人兼CEO周明博士表示:

魔搭這樣的AI模型社區堪稱AI時代的基礎設施,能將預訓練模型以較低門檻提供給廣大開發者,讓AI惠及全社會。

中國科學院院士、CCF開源發展委員會主任王懷民也認為:

開源是AI發展的重要驅動力,魔搭作為新型的AI開源社區,不僅將有力推動AI邁向廣泛的落地套用,還將助力中國從開源世界的參與者逐步成長為引領者。

需要正視的是,作為國內第一個MaaS社區,魔搭還只是一個開始。

只有當更多開發者參與其中,在得到模型服務的同時,讓AI在各個領域套用落地,不斷拓展AI模型新的發展空間和可能性,這樣一個開源社區才能真正work。

我們離大規模、可復制的AI大工業時代,才可能更近一步。

那麽,你會參與進來嗎?

魔搭社區地址:http:// modelscope.cn

—完—

@量子位 · 追蹤AI技術和產品新動態

深有感觸的朋友,歡迎贊同、關註、分享三連վ'ᴗ' ի ❤