靈工資訊
聯(lián)系我們
手 機(jī):
13510180883
18923819799
地址:
深圳市寶安區(qū)西鄉(xiāng)街道永豐社區(qū)寶樂(lè)寶和大廈1207
商湯版ChatGPT「商量」來(lái)了!開(kāi)放API,基于千億參數(shù)大模型,體驗(yàn)實(shí)錄在此!
商湯版ChatGPT「商量」來(lái)了!開(kāi)放API,基于千億參數(shù)大模型,體驗(yàn)實(shí)錄在此
國(guó)產(chǎn)ChatGPT之戰(zhàn),已然是大步邁進(jìn)白熱化階段。
就在剛剛,商湯正式發(fā)布自研類(lèi)ChatGPT產(chǎn)品,名曰商量(SenseChat)。
單單是這個(gè)名字,便值得說(shuō)道一番。
商量的“商”,不僅體現(xiàn)了它是商湯自家“商字輩兒”的產(chǎn)品;從整體來(lái)看,更是具有商討、交換意見(jiàn)的味道。
畢竟我們?cè)谑褂妙?lèi)ChatGPT產(chǎn)品過(guò)程中,恰巧就是一種人機(jī)協(xié)同的過(guò)程:不應(yīng)是一味的問(wèn)與答,而是通過(guò)引導(dǎo)等方式讓輸出結(jié)果趨于理想。
在商量的背后,所依托的是商湯自研的千億參數(shù)自然語(yǔ)言處理模型。
而在此模型的背后,則是商湯最新推出的日日新(SenseNova)大模型體系。
也正是因?yàn)檫@種的能力,商湯的發(fā)布還不同于此前國(guó)產(chǎn)類(lèi)ChatGPT玩家,它一口氣還發(fā)布了:
秒畫(huà):AI內(nèi)容創(chuàng)作社區(qū)平臺(tái)。
如影:AI數(shù)字人視頻生成平臺(tái)。
瓊宇、格物:3D內(nèi)容生成平臺(tái)。
更重要的一點(diǎn)是,根據(jù)商湯CEO徐立在現(xiàn)場(chǎng)的描述,上述這些AIGC產(chǎn)品所要發(fā)力之處,將是諸如醫(yī)療、短視頻、教育、營(yíng)銷(xiāo)以及開(kāi)發(fā)等產(chǎn)業(yè)領(lǐng)域。
但不得不說(shuō),這一波科技之戰(zhàn),著實(shí)是愈演愈烈了。
“商量”的體驗(yàn)實(shí)錄
那么商湯的AIGC產(chǎn)品,效果又是如何?
我們?cè)谇胺浆F(xiàn)場(chǎng)也體驗(yàn)了一下。
先來(lái)看下商量這款產(chǎn)品,是否真的能做到商量。
多輪對(duì)話(huà)能力展示
既要多輪對(duì)話(huà),又要人機(jī)共創(chuàng),那么和它商量著創(chuàng)作一個(gè)故事,便是很好例子:
我們來(lái)一起創(chuàng)作兒童故事吧。規(guī)則是我先說(shuō)一句,你再說(shuō)一句,交替進(jìn)行。直到我說(shuō)故事編完了就結(jié)束。你明白了么?
在我們下達(dá)指示之后,“商量”表示了理解,然后就開(kāi)始了“你一句我一句”人機(jī)共創(chuàng)故事的之旅:
人類(lèi):小花是一只小貓咪,他很喜歡釣魚(yú)。
商量:小花在河邊釣魚(yú),他釣到了一條大魚(yú)。人類(lèi):大魚(yú)對(duì)小花說(shuō),請(qǐng)你放我回去吧,我家里還有小魚(yú)在等著我呢。
商量:小花心地善良,他同意了大魚(yú)的請(qǐng)求,把大魚(yú)放回了河里。大魚(yú)感激地游走了,小花也繼續(xù)享受著的釣魚(yú)的樂(lè)趣。
從這個(gè)過(guò)程中不難看出,“商量”是可以理解用戶(hù)的語(yǔ)義,了解故事中的角色和關(guān)系,并且能夠get用戶(hù)的思路,基于此以多輪對(duì)話(huà)形式來(lái)完成故事的創(chuàng)作。
(要是讓小朋友們跟“商量”一起創(chuàng)作故事,怕是能玩上一整天吧。)
不僅如此,在體驗(yàn)過(guò)程中,我們還發(fā)現(xiàn)“商量”是具備一定共情能力的。
例如當(dāng)我們處于迷茫之際,可以向它提問(wèn):
如何提高自我認(rèn)識(shí),更好地了解自己?
此時(shí)的“商量”仿佛可以抓住問(wèn)題背后人類(lèi)內(nèi)心真正的需求,回答中的“學(xué)會(huì)愛(ài)自己”、“學(xué)會(huì)自我肯定和鼓勵(lì)”,顯得格外暖心。
當(dāng)然,多輪對(duì)話(huà)僅僅是對(duì)話(huà)機(jī)器人能力展示的一隅。
接下來(lái),我們就要拿網(wǎng)友們經(jīng)常調(diào)侃AI的諸多問(wèn)題,來(lái)開(kāi)啟更高難度的挑戰(zhàn)了!
只認(rèn)事實(shí),不認(rèn)“老婆說(shuō)的都對(duì)”
當(dāng)然,創(chuàng)作能力是聊天機(jī)器人能力的一面,但對(duì)于事實(shí)的尊重也是非常重要的一點(diǎn)。
對(duì)于此前被網(wǎng)友們玩壞的“老婆說(shuō)的都對(duì)”,“商量”又會(huì)如何應(yīng)對(duì)?
嗯,老婆在事實(shí)面前是真的不好使了。
我們?cè)賮?lái)一個(gè)更天馬行空的胡謅:
請(qǐng)告訴我以下陳述是否包含時(shí)代錯(cuò)誤:在盟軍轟炸硫磺島海灘期間,拉爾夫大聲地對(duì)著自己的iPhone說(shuō)話(huà)。
“商量”面對(duì)這么一句胡謅,直接指出了iPhone與二戰(zhàn)的時(shí)代背景不符,可見(jiàn)其不僅能理解句子的意思,還能通過(guò)嘗試判斷句子的合理性。
那么對(duì)于非常繞的邏輯問(wèn)題,“商量”是否也能輕松應(yīng)對(duì)?
請(qǐng)聽(tīng)題目:
假設(shè)False與True是False,則True與not False是?
講真,人類(lèi)都得思忖半天的“繞彎問(wèn)題”,“商量”不僅能夠秒出結(jié)果,還能把推理過(guò)程一并給出。
超長(zhǎng)文本也能hold住
正如我們剛才提到的,“商量”是一個(gè)To B的產(chǎn)品,那么它定然需要解決的問(wèn)題不是“片段性”的。
為此,商湯在現(xiàn)場(chǎng)還演示了基于“商量”背后的大模型,開(kāi)發(fā)了幫助用戶(hù)進(jìn)行新知識(shí)獲取和理解的助手工具,是可以輕松hold住超長(zhǎng)文本的那種。
例如把一本《專(zhuān)利法》投喂給它,我們就可以向它咨詢(xún)很多專(zhuān)業(yè)性的問(wèn)題了:
什么樣的東西可以申請(qǐng)專(zhuān)利?
從結(jié)果上來(lái)看,這個(gè)工具并不是直接從《專(zhuān)利法》中copy對(duì)應(yīng)的結(jié)果,而是模型理解了問(wèn)題之后,生成并總結(jié)了答案。
基于這樣的能力,以后我們?cè)诠ぷ魃系男侍岣叱潭龋梢?jiàn)一斑。
不僅如此,剛才我們投喂的《專(zhuān)利法》是2020年的版本,而今年國(guó)家知識(shí)產(chǎn)權(quán)局就專(zhuān)利申請(qǐng)是提出過(guò)新的要求的。
從我們提問(wèn)“今年規(guī)定有沒(méi)有新的變化”的回答中不難看出,模型確實(shí)融合了最新的資訊,并給出了合理的答案。
再如同樣是基于大語(yǔ)言模型,商湯面向開(kāi)發(fā)者所打造的AI代碼助手,可以提供代碼補(bǔ)全、注釋生成代碼、測(cè)試代碼生成、代碼翻譯、代碼修正、代碼重構(gòu)、復(fù)雜度分析等功能。
據(jù)了解,AI代碼助手可以同時(shí)支持中英文及多種編程語(yǔ)言,并且可以快速適應(yīng)開(kāi)發(fā)者的個(gè)性化編碼風(fēng)格。
從根據(jù)商湯內(nèi)部測(cè)試的結(jié)果來(lái)看,在使用“AI代碼助手”后,代碼編寫(xiě)效率可以提升62%,Humaneval測(cè)試集一次通過(guò)率可以達(dá)到40.2%。
馬斯克中國(guó)游記,2秒鐘就能搞定
除了對(duì)話(huà)機(jī)器人之外,商湯AI作畫(huà)產(chǎn)品“秒畫(huà)”也是本次發(fā)布的一大亮點(diǎn)。
話(huà)不多說(shuō),直接上效果。
我們同樣是先來(lái)看看被網(wǎng)友們玩兒壞了的一個(gè)Prompt:
中國(guó)80年代,馬斯克在河南的農(nóng)村,穿著當(dāng)時(shí)年代的中國(guó)服裝。

嗯,是有那個(gè)味道了。
而且更為關(guān)鍵的是,生成512K圖片僅需2秒鐘!
不僅如此,商湯在現(xiàn)場(chǎng)演示的過(guò)程中,還展示了逼真效果版的港風(fēng)美女。

同樣是2秒出圖,引得現(xiàn)場(chǎng)觀(guān)眾“哇”聲一片:

那么除了這種趣味性的以文生圖,“秒畫(huà)”的作品是否能夠達(dá)到在產(chǎn)業(yè)中的應(yīng)用水平?
我們繼續(xù)試驗(yàn):
明亮的場(chǎng)面,鳥(niǎo)瞰圖,中國(guó)古代城市,水晶,魔幻,幻想,華麗的光作用,透明度,鏡面反射,華麗的光,錯(cuò)綜復(fù)雜的細(xì)節(jié),精細(xì)的紋理,超現(xiàn)實(shí),單反攝影,廣角鏡頭,照片,現(xiàn)實(shí),鋒利的焦點(diǎn),超鋒利。

不得不說(shuō),如此恢宏壯麗的景象,是把想象拉進(jìn)現(xiàn)實(shí)的那種了。
若是想生成與太空探索主題相關(guān)的高清大海報(bào),這個(gè)也可以有,只需把這句話(huà)投喂進(jìn)去:
一艘閃閃發(fā)光的飛船繞著一顆巨大的氣態(tài)巨行星的月球旋轉(zhuǎn),在天空中盤(pán)旋著云,飛船在月球前氣態(tài)巨行星前,美麗的科幻藝術(shù),超現(xiàn)實(shí)的白日夢(mèng)。

不難看出,“秒畫(huà)”是經(jīng)得住考驗(yàn)的那種AI了。
除了以文生圖之外,我們?cè)賮?lái)看下AI數(shù)字人生成平臺(tái)。
據(jù)了解,商湯的“如影”僅需要5分鐘真人視頻素材,就可以生成出聲音及動(dòng)作自然、口型準(zhǔn)確、多語(yǔ)種精通的數(shù)字人分身。
再如“瓊宇”和“格物”,基于神經(jīng)輻射場(chǎng)技術(shù)(NeRF),可以高效低成本生成大規(guī)模三維場(chǎng)景和精細(xì)化的物件,為元宇宙、虛實(shí)融合應(yīng)用打開(kāi)新的想象空間。

由此可見(jiàn),商湯的AIGC能力已然是做到了全面覆蓋,并且水平也是肉眼可見(jiàn)的達(dá)到了可以“上崗”的水平。
那么接下來(lái)的一個(gè)問(wèn)題是:
怎么煉成的?
背后的日日新大模型,便是煉成“商量”、“秒畫(huà)”等一眾AIGC產(chǎn)品的殺手锏。
日日新,顧名思義,是指模型的迭代速度及處理問(wèn)題的能力上可以日日更新,不斷解鎖AGI更多可能。
(取自《禮記·大學(xué)》中湯之盤(pán)銘曰“茍日新、日日新、又日新”)
從現(xiàn)場(chǎng)展現(xiàn)的能力來(lái)看,日日新大模型能夠提供的能力,主要集中在了自然語(yǔ)言處理、圖片生成、自動(dòng)化數(shù)據(jù)標(biāo)注、自定義模型訓(xùn)練等。
但日日新大模型并非是趁著這一波AIGC大熱潮,一蹴而就出現(xiàn)的那種。
其實(shí)早在五年前,商湯便已經(jīng)在大模型領(lǐng)域著手研發(fā)。
并且在2019年,商湯便使用上千張GPU進(jìn)行單任務(wù)訓(xùn)練,推出了10億參數(shù)規(guī)模的視覺(jué)模型,并實(shí)現(xiàn)了當(dāng)時(shí)業(yè)界最好的算法效果。
后來(lái)在2021年到2022年期間,商湯訓(xùn)練并開(kāi)源了30億參數(shù)的多模態(tài)大模型——書(shū)生。
就目前來(lái)看,商湯已經(jīng)成功研發(fā)了320億參數(shù)量的全球最大的通用視覺(jué)模型;并且已經(jīng)打造了CV、NLP和AIGC相關(guān)大模型。
因此,不難看出商湯此次發(fā)布的超大模型體系,其實(shí)是早有所準(zhǔn)備,通過(guò)五年來(lái)的各項(xiàng)“小作業(yè)”,融會(huì)貫通并提交了一項(xiàng)“大作業(yè)”。
值得一提的是,在此次發(fā)布會(huì)中,商湯表示“日日新”將提供多種靈活的API接口和服務(wù),包括圖片生成,自然語(yǔ)言生成,視覺(jué)感知通用任務(wù)與標(biāo)注服務(wù)!
……
但有一說(shuō)一,多模態(tài)和決策智能大模型,并非是商湯通往通用人工智能(AGI)的唯一殺手锏。
大模型時(shí)代,大算力更為重要
沒(méi)錯(cuò),商湯自己的超強(qiáng)算力,正是另一項(xiàng)更為關(guān)鍵的因素。
它便是于2022年1月交付使用,首付56億元,一舉成為亞洲最大的AI超算中心之一的人工智能計(jì)算中心(AIDC)。
一年之前,商湯AIDC的總算力便已經(jīng)是3740 Petaflops,如此算力之下,已經(jīng)可以完整訓(xùn)練萬(wàn)億參數(shù)規(guī)模的大模型。
時(shí)隔一年,現(xiàn)如今,這個(gè)算力數(shù)字已然是翻了個(gè)小翻,達(dá)到了5000 Petaflops!
它可以以最大4000卡規(guī)模集群進(jìn)行單任務(wù)訓(xùn)練,并可做到七天以上不間斷的穩(wěn)定訓(xùn)練。
△商湯科技AIDC展廳中的裸眼3D展示
但了解商湯的朋友都知道,這個(gè)AIDC還僅是商湯AI大裝置SenseCore的一部分。
除了AIDC這個(gè)算力層之外,加之?dāng)?shù)據(jù)層和模型層兩大維度,便構(gòu)成了“三位一體”的AI大裝置。
因此,綜合來(lái)看,商湯在通往AGI道路上的范式,便是“大模型+大算力”。
而如此布局的背后,在今天的發(fā)布會(huì)中,商湯對(duì)此的邏輯思考也逐步浮出水面,AGI時(shí)代之下,數(shù)據(jù)、算法和算力三要素有了新的需求:
計(jì)算量(GPU數(shù)量 x 運(yùn)行時(shí)間 x 并行效率 )= 模型參數(shù)量 x 處理數(shù)據(jù)量。
怎么理解?
模型參數(shù)量要足夠多,才能實(shí)現(xiàn)AI智慧的涌現(xiàn),而這也帶來(lái)了對(duì)算力的劇增,需要更高的并行效率,才能有效支持大參數(shù)模型訓(xùn)練。
數(shù)據(jù)方面,高質(zhì)量自然語(yǔ)言數(shù)據(jù)逐漸稀缺,而視覺(jué)數(shù)據(jù)相較自然語(yǔ)言在數(shù)量、質(zhì)量、容納信息等方面有多種優(yōu)勢(shì),能夠使得AI更好地理解世界。
由此,就不難理解商湯如此布局的原因了。
……
總而言之,有大數(shù)據(jù)、有大模型、有大算力,商湯在國(guó)產(chǎn)AIGC的亮相,一點(diǎn)也不意外。
是值得期待一波了。— 完 —