捷通華聲:新范式新能力,開啟認(rèn)知智能發(fā)展大幕
5月27日,“ChatGPT與人工智能前沿技術(shù)交流會(huì)”作為2023中關(guān)村論壇展覽(科博會(huì))的系列活動(dòng)在北京成功召開。捷通華聲作為國內(nèi)領(lǐng)先的人工智能技術(shù)、產(chǎn)品與服務(wù)提供商受邀出席,并發(fā)表主題演講。
由ChatGPT引發(fā)的人工智能熱潮正在驅(qū)動(dòng)市場參與者加速新一代AI的研發(fā),一場科技和商業(yè)史上的革命性大幕正在開啟!
“ChatGPT從去年11月份開始爆紅,到現(xiàn)在大概也已經(jīng)有了半年時(shí)間,ChatGPT所表現(xiàn)出來的類人的表現(xiàn),讓我們感覺人類再一次迎來了技術(shù)驅(qū)動(dòng)發(fā)展的社會(huì)更迭。以ChatGPT為代表的大模型其實(shí)是一次完全新的變革,可能不亞于之前2006年提出的深度學(xué)習(xí)算法,包括2016年AIphaGO擊敗李世石。”捷通華聲高級(jí)研究員邢啟洲說。
大模型帶給人們感觸最深的是跟機(jī)器人聊天像在跟一個(gè)人聊天。網(wǎng)上總結(jié)了ChatGPT可以做的49件事,但實(shí)際上大模型能做的事幾百件幾千件,只要我們能想到的事大模型都能完成。
但相比互聯(lián)網(wǎng)上的demo或者測試娛樂的一款產(chǎn)品,工業(yè)界更為關(guān)注的是如何將大模型進(jìn)行真正商業(yè)化落地,最大化發(fā)揮大模型的價(jià)值。這也是目前捷通華聲正在推動(dòng)的事情。邢啟洲表示,“當(dāng)我們冷靜下來去思考這個(gè)問題的時(shí)候,我們也會(huì)發(fā)現(xiàn)如果它真的在我們的工業(yè)場景落地的話,依然存在很多不可逾越的溝壑。比如工業(yè)落地更關(guān)注的是什么,工業(yè)界落地更關(guān)注的其實(shí)是效果的下限穩(wěn)定性。而目前所有開放性的大模型大家關(guān)注的是什么,媒體關(guān)注的是什么,關(guān)注的是模型的上限,在我看來ChatGPT是上限非常高的模型,可能上限達(dá)到100分甚至以上,但是缺乏對(duì)下限的基本保證。”
除了穩(wěn)定性和正確性的問題,模型使用成本同樣不可忽視。 “今天我們在2C的場景可能測試幾條數(shù)據(jù)或者簡單去試用,這個(gè)成本是可以忽略不計(jì)的,但是我們真的要把這么大的一個(gè)龐然大物的模型真的用到每一天就有幾萬通通話的客服場景呼叫中心,這個(gè)成本就要掂量掂量,但是目前來講這個(gè)大模型不管是ChatGPT發(fā)布的大模型或者其他公司發(fā)布的模型,這個(gè)成本是不可忽略的。”
大模型從去年底推出就掀起了AIGC的浪潮,大家都會(huì)覺得大模型無所不能,真正了解行業(yè)的人都知道真正在行業(yè)中用到的模型更多還是基于檢索的模型,基于傳統(tǒng)的NLP模型,生成式的模型尤其在文本生成模型上使用的場景非常少。不是說生成模型不好,而是穩(wěn)定性的問題沒有被真正解決。
“ChatGPT確實(shí)大幅上升了我們的模型的上限,但是沒有解決我們落地的問題,它的模型可解釋性問題依然沒有給出很好的解決方案,它的穩(wěn)定性依然沒有給出可落地的方案。”
從專業(yè)知識(shí)覆蓋度上去考慮,ChatGPT有1750億的參數(shù),可以覆蓋全世界互聯(lián)網(wǎng)上的各種知識(shí),但是它真的深入行業(yè)深入專業(yè)領(lǐng)域上是很難覆蓋的。
通過一段時(shí)間探索和研究,捷通華聲結(jié)合自身在人工智能核心技術(shù)研發(fā)和產(chǎn)業(yè)化應(yīng)用所積累的經(jīng)驗(yàn),提出了巨數(shù)據(jù)巨系統(tǒng)的創(chuàng)新集成的思想。一條路徑是,把大模型繼續(xù)做大做強(qiáng),直到等待它有一天可以具備這種真的處理復(fù)雜問題的能力。還有一條路,就是我們基于這個(gè)模型底座,去創(chuàng)造一套巨系統(tǒng),包括結(jié)合巨數(shù)據(jù),從而打造的是一個(gè)復(fù)雜系統(tǒng),這個(gè)復(fù)雜系統(tǒng)是可以應(yīng)付可能我們真實(shí)世界的各種復(fù)雜問題的。
邢啟洲介紹,提出的這個(gè)系統(tǒng)一定是要以大模型為底座,但是我們會(huì)基于大模型去做很多行業(yè)屬性的數(shù)據(jù)收集訓(xùn)練,去推出各種行業(yè)模型。行業(yè)模型可能也不夠,還會(huì)推出各種任務(wù)小模型或者結(jié)合實(shí)際場景的小模型。雖然有大模型,但是還是要借助中數(shù)據(jù)、小數(shù)據(jù),才能讓它在真正的場景去落地。當(dāng)然最外面可能就可以基于我們的這套復(fù)雜系統(tǒng)衍生出各種的應(yīng)用場景,我們就可以做成一個(gè)企業(yè)大腦,可以做成一個(gè)行業(yè)專家平臺(tái)。
以這個(gè)思路為基礎(chǔ),捷通華聲推出了自己的大模型LingGPT,“捷通華聲是要解決行業(yè)痛點(diǎn),我們不跟通用大模型去做對(duì)比,因?yàn)榇竽P托阋恍銢]問題,但是捷通華聲深耕了20多年的行業(yè),要做的是為行業(yè)賦能。LingGPT首先要解決的是做到行業(yè)專家,同時(shí)做到企業(yè)大腦,而不是全人類的大腦。”
捷通華聲同時(shí)重視加強(qiáng)模型的可解釋性包括安全性的設(shè)計(jì),比如將大模型與檢索做結(jié)合,包括可能要與知識(shí)圖譜做結(jié)合。人類積累了幾千年的高質(zhì)量的知識(shí),如果不用起來的話,是解決不了這種可解釋性和安全性問題的,一定要把大模型和高質(zhì)量的知識(shí)相結(jié)合,才有可能去解決模型的穩(wěn)定性的問題。