中新網3月25日電 中國發展高層論壇2024年年會于2024年3月24-25日舉行。3月24日下午舉行了“人工智能發展與治理專題研討會”,北京智源研究院創始人、創始理事長張宏江表示,今天大熱的多模態大模型未來發展方向一定不光是做視頻生成、視頻剪輯、拍電影或是生成電視劇。從技術角度觀察,可以用它來做機器的大腦、識別外圍的世界、武裝未來的自動駕駛,從而使今天的信息系統、模型系統變成未來的行動系統。
在張宏江看來,行動系統,尤其是多模態大模型最讓人振奮的是它可以給機器人一個大腦。比如,給機器人指令從桌上的一堆玩具中抓出一個已經滅絕的動物,它能夠經過推理和識別過程,從所認識的老虎、獅子、鳥等若干種動物中,成功地抓出已經滅絕的動物恐龍。這是過去的機器人不能做到的。過去你告訴機器人抓什么東西它能抓得到,但是給它一個抽象的概念,它是無法完成的。同樣,告訴現在的機器人說渴了,機器人就會從一堆物體中抓出一個有水的瓶子。這兩個演示都說明,機器人有了多模態大模型之后,它們不再是之前簡單地聽你給它的指令,而是能夠思考你指令中的含義,這是我們看到未來自主機器人的雛形。多模態大模型今天已經能夠讓我們如此震撼。
這背后的一切,實際上是過去70年人工智能持續發展的結果。人工智能經過了三次發展浪潮。在第三次浪潮里又經過過去10年深度學習的浪潮。大模型的出現正好是2020年第三次浪潮處于低谷時,而ChatGPT3.0的出現是一個轉折點,它帶來了Sora和一系列中國的大模型。在過去十幾個月內,我們看到從語言模型、多模態模型到視覺模型,再到未來大模型的快速發展,這背后的原理是什么?一個很重要的因素就是我們今天做人工智能不再是把它當作一個算法,而是把它當作一個系統來做。今天的模型不光是規模大,而且具備通用性。這背后的驅動力是“規模增長定律”。正是這種規模效應,使它能夠解決一個又一個過去我們無法解決的問題。比如語言模型,當它只有幾十億數據時,只能解決原來自然語言處理中的一些問題,但當它超過5千億數據時,基本上自然語言中所有的問題都迎刃而解,這就是規模的能力。
大模型背后的核心到底是什么?張宏江認為是一個新的操作系統。傳統的PC時代,是經過CPU的計算產生輸出;今天大模型計算的核心已經不再是CPU,而是GPU,因此說它是一個新的操作系統。今天所有互聯網平臺公司都在努力地做大模型,其根本的一點是,如果沒有大模型,未來他們就不再是一家平臺公司。觀察過去幾年的發展過程,尤其是過去18個月的發展,我們可以總結出新的摩爾定律,即模型的能力每一到兩年提升一代,訓練的成本每18個月變成之前的1/4,模型的推理成本每4個月會變成前面的1/10。這個新摩爾定律將帶來大模型的快速普及、快速發展和快速應用。另一個推動力,就是英偉達的股票在過去12個月的突飛猛漲,該公司已經成為世界前三名最有價值的公司。整個大模型產業鏈現在都在快速地發展、快速地成長起來。大模型會賦能我們的軟件工具,賦能我們的生活,賦能我們的工作。
張宏江說,今天我們看到人工智能進入了一個新的發展階段,以大模型為代表的階段,代表了第四次技術革命(前面的三次是農業革命、工業革命、信息革命),將帶來大量的效率提高,為我們的生活提供非常多的方便,會創造巨大的價值和一個又一個新的產業。但與此同時,我們也要看到人工智能可能導致的全球性的災難性后果。為了避免這樣的危險發生,我們需要劃出一些紅線,改進治理機制;同時還要研發更多的安全性技術,控制人工智能不去跨越這些紅線。要想做到這一點,最重要的一條就是我們要堅持和加強國際科學界和政策界在安全方面的合作,只有這樣,我們才能避免這場災難的發生。