■原題:算法訓練幾乎0成本!梧桐大模型讓首批用戶吃上“螃蟹”
■記者:思文
行業(ye)大(da)(da)(da)模(mo)型(xing)正在爆炸式集中推(tui)出,關(guan)注大(da)(da)(da)模(mo)型(xing)的(de)人士(shi)都知道了行業(ye)大(da)(da)(da)模(mo)型(xing)的(de)簡單公式,通用大(da)(da)(da)模(mo)型(xing)+行業(ye)場景+訓(xun)練調(diao)優=行業(ye)大(da)(da)(da)模(mo)型(xing),因此訓(xun)練調(diao)優是企業(ye)自研大(da)(da)(da)模(mo)型(xing)不可避開的(de)重要環節(jie)。
然(ran)在其他企業還在觀(guan)望,推出(chu),演(yan)示或者調優的當(dang)下,宇(yu)視作為推出(chu)AIoT行(xing)業大模型(xing)的第一人,6月9號,其小范(fan)圍召開了大模型(xing)“梧(wu)桐”種子合(he)作伙伴(ban)簽約會并公開了“梧(wu)桐”未來的規劃。
目前“梧桐”針對需求計劃細化出三種不同模型:
l CV(計算機視覺)行業大模型
提供AI訓練、AI在(zai)線學習等服(fu)務,預計將在(zai)7月(yue)底上(shang)線,現階段(duan)已經在(zai)小范圍測試。
l NLP(自然語言處理)行業大模型
提供(gong)資料中心(xin)、大數據平(ping)臺、代碼開發等服務,這(zhe)是一款自(zi)用(yong)(yong)行業大模型,目前階段只在宇視內部使用(yong)(yong),主(zhu)要用(yong)(yong)在內部生產,精(jing)準(zhun)度要求更(geng)高。
l MM(多模態)行業大模型
提供Vlog等服務,目前已(yi)在樂園景(jing)區、鄉(xiang)村(cun)振(zhen)興等場(chang)景(jing)的視(shi)頻宣傳(chuan)上有豐富的落(luo)地案例(li)。
那打出“AIGC平權”旗幟的宇視將怎么把技術平權和知識平權真正融進中小型企業業務里?
CPS中安網作為特邀媒體就此疑問與部(bu)分(fen)宇視(shi)核心高管面對面進行了“圓桌對話”。
1、大模型趨勢下
中小型企業怎么用好數據?
中小(xiao)企(qi)(qi)業(ye)(ye)(ye)作為(wei)中國經濟發展的重要主體之(zhi)一,據工信部公布(bu)的數據,2022年我國日均新設企(qi)(qi)業(ye)(ye)(ye)達2.38萬(wan)戶(hu),中小(xiao)微企(qi)(qi)業(ye)(ye)(ye)數量已超過5200萬(wan)戶(hu),在如今大(da)模(mo)型(xing)熱(re)潮(chao)下,不少(shao)中小(xiao)企(qi)(qi)業(ye)(ye)(ye)都(dou)在關注行業(ye)(ye)(ye)大(da)模(mo)型(xing)將(jiang)會(hui)如何為(wei)自(zi)身企(qi)(qi)業(ye)(ye)(ye)真(zhen)正(zheng)做到(dao)降本增效。
雖然數字化轉型理念愈來愈普及,不少中小企業都想搭上“高效”這趟車,但“數據怎么用?”“花費多少成本?”這兩大(da)疑(yi)慮(lv)把大(da)部分中小(xiao)企業攔在(zai)了(le)車門(men)外(wai)。
除此(ci)之外,雖說行(xing)業都(dou)在認(ren)可“ALL in AI”這一(yi)現狀,但不少中小型(xing)企業對(dui)于AI的(de)理解可能仍局限性(xing)停留(liu)在人臉識(shi)別。
宇(yu)視云智能產品部部長湯利(li)波告訴CPS中安網,作為直(zhi)接(jie)接(jie)觸到市場(chang)(chang)動向脈搏(bo)的中小(xiao)型企業(ye),其完全可以(yi)利(li)用(yong)數據針對性訓練一些(xie)細分業(ye)務場(chang)(chang)景的算(suan)法。“通(tong)過場(chang)(chang)景化算(suan)法指標能力的提升(sheng),有機(ji)會去提升(sheng)解(jie)決(jue)方案的增(zeng)值性,包括(kuo)服務收益的增(zeng)值性。”
舉個簡(jian)單(dan)的(de)例(li)子,在游(you)(you)樂園娛(yu)樂等場所,大部(bu)分(fen)人可能(neng)認為攝(she)(she)像頭只是起到(dao)(dao)安全防控的(de)作(zuo)用(yong)(yong),但假設負責(ze)這(zhe)個場景業務(wu)的(de)企(qi)業,愿意(yi)讓攝(she)(she)像頭搭載上提(ti)前訓練好的(de)大模(mo)型,訓練好的(de)大模(mo)型經過推理后,將其視頻數據進行自動(dong)分(fen)割、自動(dong)識別、剪輯美化(hua),游(you)(you)樂園就能(neng)從原(yuan)(yuan)有的(de)出售(shou)游(you)(you)客(ke)(ke)圖片的(de)業務(wu)升級到(dao)(dao)游(you)(you)客(ke)(ke)專屬vlog,這(zhe)便讓原(yuan)(yuan)本只是躺在存儲(chu)里的(de)數據得(de)到(dao)(dao)了進一步調動(dong)應(ying)用(yong)(yong)。
可以(yi)明顯看到(dao),在大模型趨(qu)勢下,對于中小型企業而言,其如何(he)通過大模型利用數(shu)據(ju)達到(dao)降本(ben)增效的(de)作用,結果還是(shi)(shi)開源或者(zhe)節流(liu),省下人(ren)力、時間、精力成本(ben)的(de)同時對現(xian)有業務進行升級賦能,將服務收益最大化或許(xu)才是(shi)(shi)正解。
基于(yu)此,對于(yu)判斷(duan)市場(chang)上任意一項新技術或者(zhe)新產品是否(fou)值(zhi)得應(ying)用,中小型(xing)企(qi)業往往更加在意實際投入成(cheng)本幾何(he)。關于(yu)成(cheng)本問題(ti),會上,宇視的大模型(xing)也給出了階段性答案(an)。
2、幾乎0成本訓練
梧桐CV行業大模型將上線
“我們需要更(geng)多的(de)渠道能夠有(you)這種能力,更(geng)好(hao)的(de)和(he)宇視合作,而不是只有(you)幾(ji)家(jia)壟斷的(de)市場。”宇視CPO朱兵說。
具體來說,宇視(shi)(shi)的賦能之道是,在訓練(lian)側上(shang),用(yong)戶企業(ye)可(ke)以(yi)遠程(cheng)通過互(hu)聯網訪問之后來訓練(lian)算法,宇視(shi)(shi)會(hui)承擔(dan)云的租用(yong)費用(yong),為用(yong)戶企業(ye)省去前期訓練(lian)需要(yao)的成本,企業(ye)可(ke)以(yi)幾乎0成本獲得宇視(shi)(shi)開通的大模型訓練(lian)賬號,在訓練(lian)過程(cheng)中,會(hui)有(you)宇視(shi)(shi)專門(men)的技術團隊進(jin)行支持(chi)。
在推(tui)理側上,宇視通過將場景(jing)化的(de)算(suan)(suan)法進行剝離,也就是將相對小模型的(de)算(suan)(suan)法部(bu)署(shu)到宇視邊(bian)緣端的(de)設備上,一(yi)定(ding)程度上避免合作(zuo)伙伴為此額(e)外部(bu)署(shu)一(yi)個幾千萬起步(bu)的(de)超算(suan)(suan)機房(fang)。
此外(wai),算(suan)法(fa)拓展在目前階(jie)段仍(reng)屬于煙囪(cong)式(shi),即(ji)使(shi)用戶需求很(hen)相近(jin),但由(you)于對象(xiang)的不同還是需要重(zhong)新生成算(suan)法(fa),容易(yi)導(dao)致投入產出比和客(ke)戶需求之間(jian)的矛盾,而預(yu)計7月底正式(shi)上線的“梧桐CV行業大(da)模型”可(ke)以較好解決這個(ge)問題。
舉個(ge)例子,假設現在有(you)60多(duo)萬(wan)個(ge)體(ti)育館(guan)(guan),300多(duo)萬(wan)套器材(cai),這60多(duo)萬(wan)個(ge)體(ti)育館(guan)(guan)的(de)器材(cai)放(fang)置(zhi)地點都不同,此時(shi)項目方需要(yao)知道所有(you)館(guan)(guan)的(de)器材(cai)的(de)使(shi)用(yong)頻率和(he)大眾(zhong)愿意使(shi)用(yong)哪類健身(shen)器材(cai),這時(shi)候如果用(yong)小模型(xing)(xing)就需要(yao)采集各(ge)個(ge)體(ti)育館(guan)(guan)的(de)數據(ju)進(jin)行(xing)(xing)對(dui)比(bi)再針對(dui)性地多(duo)次訓(xun)練(lian),而“梧桐CV行(xing)(xing)業大模型(xing)(xing)”卻能(neng)在比(bi)較小的(de)數據(ju)量情況下,做到(dao)泛化識(shi)別和(he)推理,即使(shi)器材(cai)對(dui)象(xiang)千差萬(wan)別,但省去了(le)二次訓(xun)練(lian)、學習(xi)的(de)環節。
場景多(duo)N倍,算法獲(huo)得率(lv)提升80%,算法精(jing)準度從(cong)85%提升至95%,讓IT工程(cheng)訓練(lian)師訓練(lian)算法,更(geng)容易(yi)解(jie)決行業(ye)Know-How問題,入(ru)門(men)門(men)檻更(geng)低(di),大模型(xing)梧桐的優勢也(ye)由此凸顯,
目前“梧桐CV行業大模型”已經和第一批合作伙伴完成落地計劃的簽約,率先在體育、教育、交通、零售等領域進行首發落地。
相信在未來,大(da)模型(xing)的“訓練”“推理(li)”兩個關(guan)鍵詞優勢將會日益凸(tu)顯,據了解,為(wei)保障大(da)模型(xing)的順利運行,宇視(shi)目前部署在云邊端芯片款(kuan)型(xing)超過50款(kuan),支持的算法種類超過1000個,模型(xing)數過萬,產品款(kuan)型(xing)過千。
前期成本宇視承擔,合作伙伴幾乎0成本接入,這么大的支持力度,相信業內人士都會十分好奇,宇視到底靠梧桐大模型怎么實現盈利?
3、瞄準生態價值
力爭高效落地
傳統意義上,做了一個(ge)軟件,投(tou)入100萬,就要力爭賣到(dao)200萬,最(zui)后賺100萬,光明正大的追求利潤(run)是企業繞不開的話題(ti)。
但(dan)這(zhe)次,宇(yu)視(shi)并沒有打算使(shi)(shi)用傳統的(de)賣軟件直(zhi)接(jie)獲利策略,而是(shi)通(tong)過讓(rang)利給合作伙伴(ban),讓(rang)合作伙伴(ban)通(tong)過使(shi)(shi)用“梧桐”得到多(duo)個專屬的(de)“行(xing)業軟件工程師”。“讓(rang)宇(yu)視(shi)的(de)渠道盈利,讓(rang)他們有進(jin)入(ru)一些新的(de)業務模式的(de)可能(neng)。”朱兵說道。
在這個平權時代,支撐宇視此次這么大膽的行徑的信心和念想究竟來自哪里?
“平(ping)權時代,最大的競爭力在(zai)于(yu)你的效率,在(zai)于(yu)公司看清楚自己的定位之后能(neng)夠第一時間全力撲(pu)上去(qu)做。”
2012年(nian),宇(yu)視(shi)捕捉到(dao)(dao)人(ren)工智能的(de)發展趨勢,同年(nian)便開始在(zai)深(shen)度學(xue)習(xi)領域進行投入,2016年(nian),宇(yu)視(shi)推(tui)出初(chu)代(dai)基于DL的(de)AIoT產品,如(ru)今來(lai)到(dao)(dao)大(da)模(mo)型爆炸階段,宇(yu)視(shi)又成為第(di)一個推(tui)出“AIoT行業大(da)模(mo)型”的(de)第(di)一人(ren)。
2023年,宇視這次對于“梧桐”大模型的定位到底是什么?
沒錯,就是落地化,工程化。正如微軟(ruan)將GPT-4對接(jie)Office、金山將其大(da)模型產品“WPS AI”接(jie)入(ru)WPS,大(da)模型最終的落地還(huan)得是在硬件(jian)上(shang)。
那宇視(shi)怎(zen)么快(kuai)速(su)落地實現工(gong)程化?總(zong)結(jie)為(wei)以(yi)下(xia)幾點:
1、原有的深度學習積累和產品工程化落地可繼承
2、站在通用大模型的肩膀上開發自己的行業大模型
3、通過“剪枝”和“蒸餾”等技術,實現行業大模型的邊緣側部署
4、開放能力給合作伙伴,同時有專門的培訓和技術(shu)服務(wu)體系保障
也許(xu)正如(ru)此次宇(yu)視簽約種子(zi)伙伴之一的萬(wan)店掌所言,眾多行業大模型中為什么選(xuan)擇宇(yu)視,其(qi)實占比很大一部分原(yuan)因是其(qi)本身已(yi)經(jing)和(he)宇(yu)視有過合作(zuo),對(dui)宇(yu)視這個(ge)(ge)品牌已(yi)經(jing)存在(zai)一定的認(ren)知力(li)和(he)認(ren)可(ke)度,剛好宇(yu)視在(zai)這個(ge)(ge)階段推出了(le)大模型就相(xiang)當于為合作(zuo)伙伴提供(gong)了(le)一條龍服務(wu),省去了(le)對(dui)其(qi)他(ta)新品牌的學習、切換成本,選(xuan)擇宇(yu)視會適配度更高。
當然,在這個數據量爆炸的(de)時代下(xia),不少企(qi)(qi)業還是會十分在意保(bao)密性,而目前由(you)于大部分中小(xiao)企(qi)(qi)業不具備私有(you)云的(de)部署(shu)能(neng)力,因此愿意上云的(de)企(qi)(qi)業的(de)數據會相(xiang)對集(ji)中在公有(you)云上,一旦(dan)拿出(chu)來(lai)訓練是否會產生泄漏的(de)風險?
“我(wo)們前期在接觸合(he)作伙伴過程中,也有客戶(hu)有安(an)(an)全(quan)性的疑慮(lv),主(zhu)要疑慮(lv)在原有數據(ju)是否(fou)外(wai)泄(xie)和訓練成果收否(fou)會被(bei)無償占(zhan)用(yong)兩方(fang)面”湯利波說道。而宇視“梧桐”也將通(tong)過相關技術進行分權、分域(yu),建立完善的權限管(guan)理和安(an)(an)全(quan)管(guan)控制度(du),融合(he)等方(fang)式(shi)保(bao)證訓練成果的安(an)(an)全(quan)性和獨(du)享性。
4、大模型戰場已開局
是開始還是結束?
風(feng)起于(yu)青萍之(zhi)末,浪(lang)成于(yu)微瀾之(zhi)間。
相(xiang)對之前企業(ye)拼數(shu)據(ju)(ju)樣本,拼私有(you)的(de)(de)(de)訓練平臺,拼技術架構的(de)(de)(de)小模(mo)型(xing)(xing)(xing)AI時代,如今隨著大(da)模(mo)型(xing)(xing)(xing)相(xiang)繼開源后(hou),有(you)基礎(chu)的(de)(de)(de)企業(ye)大(da)都可以基于(yu)開源組(zu)件(jian)進行自(zi)身大(da)模(mo)型(xing)(xing)(xing)的(de)(de)(de)自(zi)研,先用(yong)通(tong)用(yong)大(da)模(mo)型(xing)(xing)(xing)把(ba)原始的(de)(de)(de)大(da)量行業(ye)場(chang)景的(de)(de)(de)知識數(shu)據(ju)(ju)清洗一遍(bian),再(zai)把(ba)顯著目(mu)標(biao)值給(gei)提取出來(lai),去(qu)重(zhong)后(hou)形成行業(ye)數(shu)據(ju)(ju)庫,最(zui)終(zhong)投喂給(gei)通(tong)用(yong)大(da)模(mo)型(xing)(xing)(xing)訓練出一個行業(ye)大(da)模(mo)型(xing)(xing)(xing)。
Open AI用了上萬塊英偉達GPU喂出了一個ChatGPT,浪潮掀到(dao)中國,國內千模大戰已拉開(kai),行業大模型或將(jiang)是未來各個領域(yu)都會去追尋的模式。
縱觀安防行業幾(ji)十年的(de)(de)發(fa)展,從模(mo)擬階(jie)段的(de)(de)爭(zheng)(zheng)奪(duo)攝(she)像頭代理權,到網絡數字階(jie)段的(de)(de)系統(tong)業務成焦(jiao)點(dian),再到智(zhi)能化(hua)階(jie)段的(de)(de)ALL in AI,如(ru)今(jin)已到大模(mo)型卷入階(jie)段,或(huo)許正如(ru)宇視CEO張鵬(peng)國曾在深圳安博會舉辦期間抒發(fa)的(de)(de)經典語錄所(suo)言:“意(yi)識(shi)到這是場戰爭(zheng)(zheng)的(de)(de)時候(hou),戰爭(zheng)(zheng)已經結束了,機會不會等待后(hou)知后(hou)覺(jue)的(de)(de)傲慢(man)。”
[出處] 思文(wen), 算法訓練幾乎0成本!梧桐大模型讓(rang)首批用戶吃上“螃蟹”.CPS中(zhong)安網, 2024-06-14