9月11日,中國(guó)基金報(bào)記者獲悉,百度創(chuàng)始人、董事長(zhǎng)兼CEO李彥宏在近日和員工交流中,詳談了三個(gè)大模型認(rèn)知誤區(qū),涵蓋大模型競(jìng)爭(zhēng)、開(kāi)源模型效率、智能體趨勢(shì)等熱點(diǎn)話題。
李彥宏認(rèn)為,目前外界對(duì)大模型有相當(dāng)多的誤解。未來(lái)大模型之間的差距可能會(huì)越來(lái)越大。大模型的天花板很高,現(xiàn)在距離理想情況還相差非常遠(yuǎn),所以模型要不斷快速迭代、更新和升級(jí),不斷滿足用戶需求,以及降本增效。
未來(lái)大模型之間的差距會(huì)越來(lái)越大
領(lǐng)先對(duì)手6個(gè)月就贏了
近年來(lái),行業(yè)大模型持續(xù)涌現(xiàn),業(yè)內(nèi)也開(kāi)始出現(xiàn)一種觀點(diǎn),認(rèn)為大模型之間的能力已經(jīng)沒(méi)有壁壘。
李彥宏并不認(rèn)同這種說(shuō)法,他認(rèn)為外界對(duì)大模型有相當(dāng)多的誤解,“每次新模型發(fā)布,都要和GPT-4o做比較,說(shuō)我的得分已經(jīng)跟它差不多了,甚至某些單項(xiàng)上得分已經(jīng)超過(guò)它了。但這并不能證明這些新發(fā)的模型跟OpenAl最先進(jìn)的模型相比,已經(jīng)沒(méi)有那么大的差距了”。
李彥宏表示,模型之間的差距是多維度的,一是能力方面,即理解能力、生成能力、邏輯推理能力、記憶能力等基本能力上的差距;二是成本方面,有些模型雖能達(dá)到同樣效果,但成本高、推理速度慢,還是不如先進(jìn)模型。
此外就是對(duì)于測(cè)試集的over-fitting(過(guò)擬合),他指出很多模型為了證明自己,會(huì)在發(fā)布之后去打榜,會(huì)去猜測(cè)試題目、答題技巧。從榜單上看,或許模型的能力已經(jīng)很接近了,“但到實(shí)際應(yīng)用中,實(shí)力還是有明顯差距的”。
李彥宏認(rèn)為,部分自媒體的炒作,加上每個(gè)新模型發(fā)布時(shí)的宣傳,使得大家認(rèn)為模型之間的能力差距已經(jīng)比較小了,其實(shí)不是這樣。
“我們需要看到,一方面,模型之間的能力還有比較明顯的差距;另一方面,天花板很高,你今天做到的跟你實(shí)際想要做到的,以及跟理想狀態(tài)比還差得非常遠(yuǎn)。所以模型還需要不斷快速地去迭代、去更新、去升級(jí)。”李彥宏表示,不同模型之間的差距不是越來(lái)越小,而是會(huì)越來(lái)越大。
李彥宏還認(rèn)為,每個(gè)公司都處在完全競(jìng)爭(zhēng)的市場(chǎng)環(huán)境中,不管做什么都會(huì)有很多競(jìng)爭(zhēng)對(duì)手,如果能永遠(yuǎn)保證領(lǐng)先對(duì)手12~18個(gè)月,那是天下無(wú)敵的。“不要覺(jué)得12~18個(gè)月是很短的時(shí)間,哪怕能保證永遠(yuǎn)領(lǐng)先競(jìng)爭(zhēng)對(duì)手6個(gè)月,那就贏了。”
開(kāi)源模型效率不高
無(wú)法在商業(yè)領(lǐng)域與閉源模型競(jìng)爭(zhēng)
針對(duì)業(yè)內(nèi)關(guān)注的開(kāi)源模型與閉源模型差距縮小,是否會(huì)影響閉源大模型公司商業(yè)模式的問(wèn)題。李彥宏直言,一個(gè)模型除了能力、效果之外,還要看效率,在效率上開(kāi)源模型是不行的。
“閉源模型準(zhǔn)確地講應(yīng)該叫商業(yè)模型,商業(yè)化的模型是無(wú)數(shù)個(gè)用戶或者說(shuō)客戶共享同樣的資源,分?jǐn)傃邪l(fā)成本,分?jǐn)偼评碛玫臋C(jī)器資源和GPU,GPU的使用效率是最高的,百度文心大模型3.5、4.0的GPU使用率都超過(guò)90%。”李彥宏稱。
他表示,在大模型時(shí)代之前,大家習(xí)慣了開(kāi)源,這意味著免費(fèi)、成本低。比如開(kāi)源的Linux,因?yàn)橐呀?jīng)有了電腦,所以使用Linux是免費(fèi)的。但這些在大模型時(shí)代都不成立,大模型推理是很貴的,開(kāi)源模型不會(huì)送算力,無(wú)法實(shí)現(xiàn)算力的高效利用。
“文心大模型每天調(diào)用量超過(guò)6億次,每天生成的token數(shù)超過(guò)萬(wàn)億個(gè),哪個(gè)開(kāi)源模型可以說(shuō)自己一天調(diào)用量是多少、生成了多少token?沒(méi)有人用的話,成本怎么分擔(dān)?推理成本怎么能夠跟商業(yè)化模型相比呢?”李彥宏問(wèn)道。
因此,李彥宏認(rèn)為,在教學(xué)科研等領(lǐng)域,開(kāi)源模型是有價(jià)值的;但在商業(yè)領(lǐng)域,當(dāng)大家追求的是效率、效果和最低成本時(shí),開(kāi)源模型是沒(méi)有優(yōu)勢(shì)的。
智能體是最重要的發(fā)展方向
但還不是業(yè)界共識(shí)
談及大模型應(yīng)用的發(fā)展階段,李彥宏認(rèn)為首先出現(xiàn)的是Copilot,對(duì)人進(jìn)行輔助;接下來(lái)是Agent智能體,有一定的自主性,能自主使用工具、反思、自我進(jìn)化;這種自動(dòng)化程度再發(fā)展,就會(huì)變成AI Worker,能獨(dú)立完成各方面的工作。
不過(guò),李彥宏坦言,“智能體是大模型最重要的發(fā)展方向”這個(gè)判斷其實(shí)是一個(gè)非共識(shí)。此前百度Create大會(huì)發(fā)布了AgentBuilder、AppBuilder、ModelBuilder三個(gè)產(chǎn)品,其中AgentBuilder和AppBuilder都是講智能體的,但目前像百度這樣把智能體作為大模型最重要的戰(zhàn)略、最重要的發(fā)展方向的公司并不多。
為什么百度這么強(qiáng)調(diào)智能體?李彥宏也給出了答案,即智能體的門(mén)檻低。“我們?nèi)ツ暾f(shuō)要卷應(yīng)用,大家都去做應(yīng)用,其實(shí)很多人還是不知道該怎么做,大家不知道怎么從模型變成應(yīng)用”。
對(duì)此,李彥宏認(rèn)為智能體提供了一個(gè)非常直接、非常高效、非常簡(jiǎn)單的方式,在模型之上構(gòu)建智能體是相當(dāng)方便的,“這也是為什么如今每周都有上萬(wàn)個(gè)新的智能體在文心平臺(tái)上被創(chuàng)造出來(lái)。智能體的日均分發(fā)次數(shù)已快速增長(zhǎng)至800萬(wàn)次”。
李彥宏還表示配資炒股網(wǎng)股票,在智能體方面,公司已經(jīng)看到了趨勢(shì),也有比較好的先決條件,即除了模型本身的能力比較強(qiáng)大之外,還有很好的分發(fā)通路。因此他們也是最能幫助這些開(kāi)發(fā)者分發(fā)智能體的公司。
文章為作者獨(dú)立觀點(diǎn),不代表股票配資知識(shí)網(wǎng)觀點(diǎn)