9月11日,中國基金報記者獲悉,百度創始人、董事長兼CEO李彥宏在近日和員工交流中,詳談了三個大模型認知誤區,涵蓋大模型競爭、開源模型效率、智能體趨勢等熱點話題。
李彥宏認為,目前外界對大模型有相當多的誤解。未來大模型之間的差距可能會越來越大。大模型的天花板很高,現在距離理想情況還相差非常遠,所以模型要不斷快速迭代、更新和升級,不斷滿足用戶需求,以及降本增效。
未來大模型之間的差距會越來越大
領先對手6個月就贏了
近年來,行業大模型持續涌現,業內也開始出現一種觀點,認為大模型之間的能力已經沒有壁壘。
李彥宏并不認同這種說法,他認為外界對大模型有相當多的誤解,“每次新模型發布,都要和GPT-4o做比較,說我的得分已經跟它差不多了,甚至某些單項上得分已經超過它了。但這并不能證明這些新發的模型跟OpenAl最先進的模型相比,已經沒有那么大的差距了”。
李彥宏表示,模型之間的差距是多維度的,一是能力方面,即理解能力、生成能力、邏輯推理能力、記憶能力等基本能力上的差距;二是成本方面,有些模型雖能達到同樣效果,但成本高、推理速度慢,還是不如先進模型。
此外就是對于測試集的over-fitting(過擬合),他指出很多模型為了證明自己,會在發布之后去打榜,會去猜測試題目、答題技巧。從榜單上看,或許模型的能力已經很接近了,“但到實際應用中,實力還是有明顯差距的”。
李彥宏認為,部分自媒體的炒作,加上每個新模型發布時的宣傳,使得大家認為模型之間的能力差距已經比較小了,其實不是這樣。
“我們需要看到,一方面,模型之間的能力還有比較明顯的差距;另一方面,天花板很高,你今天做到的跟你實際想要做到的,以及跟理想狀態比還差得非常遠。所以模型還需要不斷快速地去迭代、去更新、去升級。”李彥宏表示,不同模型之間的差距不是越來越小,而是會越來越大。
李彥宏還認為,每個公司都處在完全競爭的市場環境中,不管做什么都會有很多競爭對手,如果能永遠保證領先對手12~18個月,那是天下無敵的。“不要覺得12~18個月是很短的時間,哪怕能保證永遠領先競爭對手6個月,那就贏了。”
開源模型效率不高
無法在商業領域與閉源模型競爭
針對業內關注的開源模型與閉源模型差距縮小,是否會影響閉源大模型公司商業模式的問題。李彥宏直言,一個模型除了能力、效果之外,還要看效率,在效率上開源模型是不行的。
“閉源模型準確地講應該叫商業模型,商業化的模型是無數個用戶或者說客戶共享同樣的資源,分攤研發成本,分攤推理用的機器資源和GPU,GPU的使用效率是最高的,百度文心大模型3.5、4.0的GPU使用率都超過90%。”李彥宏稱。
他表示,在大模型時代之前,大家習慣了開源,這意味著免費、成本低。比如開源的Linux,因為已經有了電腦,所以使用Linux是免費的。但這些在大模型時代都不成立,大模型推理是很貴的,開源模型不會送算力,無法實現算力的高效利用。
“文心大模型每天調用量超過6億次,每天生成的token數超過萬億個,哪個開源模型可以說自己一天調用量是多少、生成了多少token?沒有人用的話,成本怎么分擔?推理成本怎么能夠跟商業化模型相比呢?”李彥宏問道。
因此,李彥宏認為,在教學科研等領域,開源模型是有價值的;但在商業領域,當大家追求的是效率、效果和最低成本時,開源模型是沒有優勢的。
智能體是最重要的發展方向
但還不是業界共識
談及大模型應用的發展階段,李彥宏認為首先出現的是Copilot,對人進行輔助;接下來是Agent智能體,有一定的自主性,能自主使用工具、反思、自我進化;這種自動化程度再發展,就會變成AI Worker,能獨立完成各方面的工作。
不過,李彥宏坦言,“智能體是大模型最重要的發展方向”這個判斷其實是一個非共識。此前百度Create大會發布了AgentBuilder、AppBuilder、ModelBuilder三個產品,其中AgentBuilder和AppBuilder都是講智能體的,但目前像百度這樣把智能體作為大模型最重要的戰略、最重要的發展方向的公司并不多。
為什么百度這么強調智能體?李彥宏也給出了答案,即智能體的門檻低。“我們去年說要卷應用,大家都去做應用,其實很多人還是不知道該怎么做,大家不知道怎么從模型變成應用”。
對此,李彥宏認為智能體提供了一個非常直接、非常高效、非常簡單的方式,在模型之上構建智能體是相當方便的,“這也是為什么如今每周都有上萬個新的智能體在文心平臺上被創造出來。智能體的日均分發次數已快速增長至800萬次”。
李彥宏還表示配資炒股網股票,在智能體方面,公司已經看到了趨勢,也有比較好的先決條件,即除了模型本身的能力比較強大之外,還有很好的分發通路。因此他們也是最能幫助這些開發者分發智能體的公司。
文章為作者獨立觀點,不代表股票配資知識網觀點