科技大廠競逐AIGC,中國的ChatGPT在哪?
最近,AI(人工智能)圈一股以“ChatGPT”為核心的熱潮從美國“硅谷”涌入中國。
2022年11月底,初創公司OpenAI發布了名為ChatGPT的對話式聊天機器人模型,一經推出,便在網絡上迅速走紅。
進入2023年,微軟推新,谷歌入局,“ChatGPT”熱潮迅速升溫,國內的科技巨頭也陸續涌入潮中。ChatGPT發布后,包括百度、科大訊飛、京東等在內的多家企業紛紛公布自己在AI領域的布局。
圖源:OpenAI官網
中國AI水平與ChatGPT有多大的差距?中國如何訓練出這樣的GPT大模型?難點又在哪里?
ChatGPT是AIGC的一種實現。在AIGC的大模型建設和應用層面,國內企業在技術基礎和創新環境上都存在著相對優勢。
首先,國內持續投入大模型研發、技術基礎扎實。目前,阿里達摩院的多模態大模型M6參數量已達10萬億,是全球最大的AI預訓練模型;華為盤古、百度文心等大模型的參數量都超過了千億,其中百度文心模型參數量已經達到2600億,不遜于GPT-3。
圖片來源:鈦媒體結合東吳證券數據整理而成
其次,國內加快“產業數字化轉型”、實現人工智能與實體經濟融合等政策為人工智能提供了創新發展環境。近年來,我國發布了一系列政策文件,為人工智能核心技術攻關、產品落地應用以及探索發展新模式新路徑提供支持。
把握優勢的同時,也要看到目前面臨的一些挑戰。如AI領軍人才相對短缺,AI與實體經濟的融合程度仍需進一步加深等等。對此,董曉飛建議,要特別關注一些底層技術的發展,如大模型框架、算法等,還要進一步拓展AI的應用場景。
這場由硅谷率先發起的新一輪“軍備競賽”正式進入風口,但是,對于國內科技公司而言,加入戰場之前,真正需要思考的是應用場景的變革。
01 科技大廠競逐AIGC
2022年11月30日,OpenAI首席執行官山姆·阿爾特曼當天發布了一則推特,“今天我們推出了ChatGPT,嘗試在這里與它交談”,還包括一個鏈接,任何人都可以點擊鏈接,免費與ChatGPT交談。
與Siri、小愛同學等語音助手類似,ChatGPT也是人機交互應用的一種。但在與ChatGPT“對話”的過程中,人們發現它的“智慧程度”遠超其他的人工智能機器人。除了聊天,ChatGPT被網友們用來寫文案、翻譯文本、為代碼糾錯,甚至用來編寫代碼。
憑借出色的表現,ChatGPT僅用兩個月便吸引了超過1億用戶的關注,一躍成為20年來互聯網領域增長最快的消費類應用。
北京時間2月7日凌晨,美國科技巨頭谷歌緊急入局,宣布基于LaMDA大模型的人工智能對話式機器人“Bard”正在進行內測。次日,微軟宣布推出由ChatGPT支持的最新版本Bing搜索引擎和Edge瀏覽器。臉書也表示,將向OpenAI支付數百萬美元,采用ChatGPT為Facebook和Instagram生成創作者內容。亞馬遜成立了一個小型工作組,拓展ChatGPT等AI工具對企業的工作職能……
ChatGPT火爆,搜索引擎巨頭百度率先坐不住了。
就在谷歌官宣Bard內測的當天下午,百度官宣了大模型新項目“文心一言”(ERNIE Bot),并表示預計在3月完成內測。隨后一段時間,阿里巴巴、360、科大訊飛、騰訊等多家國內企業紛紛表示對AI技術發展的關注。2月10日,京東云宣布旗下言犀人工智能應用平臺將推出產業版ChatGPT--ChatJD。
可見,大廠的態度十分鮮明:ChatGPT已經是既定的未來,這場新的科技競技賽哨聲響起,誰都不甘落于下風。從科技巨頭,到行業龍頭,中國企業競逐AI賽道,AIGC(利用人工智能技術來生成內容)等人工智能概念在股市一路狂飆,雖然在監管出手后很快平息躁動,但漲勢依然存在。
ChatGPT在全球的流行正在推動AIGC產業化全面提速,將引領創成式AI新變革。
02 大廠如何應對ChatGPT的挑戰?
GPT是OpenAI推出的AI大模型系列。從2018年到2022年,OpenAI先后迭代并推出了GPT-1、GPT-2、GPT-3和InstructGPT,此次發布的ChatGPT就是在GPT-3的基礎上通過指令微調后得到的。
圖源:OpenAI官網
結果,2022年年底ChatGPT實現了現象級的傳播,這出乎制作團隊所料。OpenAI用了5年時間在GPT大模型迭代上完成了一場自我革命,在對話的場景中實現爆發。
所以說ChatGPT的成功并非偶然,“OpenAI在GPT系列模型的基礎上,對算法、算力、數據等人工智能關鍵要素都進行了一定的升級和優化。”中國信通院云計算與大數據研究所人工智能部副主任董曉飛說。
算法、算力及數據是人工智能行業發展的三大核心要素。
在算法層面,ChatGPT的基礎是世界上最強大的LLM(大語言模型)之一——GPT-3,同時引入了基于人類反饋的強化學習方法,提高了對話的質量。“從GhatGPT的表現上來看,它的精確性和整個性能效果確實提高了。”董曉飛說。
同時,AI的訓練和使用也需要強大的算力支持。ChatGPT的訓練是在微軟云上進行的,在全球云計算市場,微軟云的市場份額排名第二。高水平、高市場份額,再加上芯片技術的高速發展,這都為ChatGPT的橫空出世奠定了堅實的算力基礎。
除了算法和算力,AI大模型的進步迭代,需要大量的數據進行訓練。2020年發布的GPT-3,其訓練參數量已經達到了驚人的1750億個,“大量的數據被反復‘喂’給ChatGPT。”
而且,ChatGPT的訓練成本支出巨大。據Lambda Labs首席科學官Chuan li介紹,擁有1750億個參數的GPT-3單次訓練成本達到460萬美元。在知乎上,網友在討論ChatGPT時,也都認為它很“燒錢”。因此,可以說ChatGPT是一個靠大算力、高成本,用大規模的數據“喂”出來的AI模型。
03 看清方向,謹慎入局
ChatGPT總共可以分為三個訓練階段:人工“投喂”數據進行標注;類似于獎勵模型,對輸出的內容進行排序和比較;強化學習,利用上一階段的內容升級。每一階段都是“燒錢”換來的,資本的門檻無形隔斷了絕大部分企業。
董曉飛指出,基于大模型的聊天機器人成本投入巨大,“企業前期投入需保持一定的謹慎,且需要看清方向。”
“目前來看,國內大模型開發廠商一是布局以大模型為基礎的通用對話、生成等能力;二是將其能力整合到搜索引擎、智能客服、智能音箱等產品線中;三是通過能力調用為中小企業滿足具體場景落地需求。”董曉飛說。
隨著ChatGPT的爆火,隨之而來的安全、隱私保護、知識產權等問題也值得關注。“目前國外出現有學生使用ChatGPT寫論文作弊的情況。模型使用大量的數據進行訓練,也存在使用過程中可能提供他人創作的侵權行為風險。”董曉飛認為,如何防止ChatGPT類產品的濫用對社會產生潛在負面影響亟須得到重視,“更希望我們目前的一些主流企業、科研機構,在生成式AI上發力,能引領新時代的AI發展。”
我愛方案網是一個電子方案開發供應鏈平臺,提供從找方案到研發采購的全鏈條服務。找方案,上我愛方案網!在方案超市找到合適的方案就可以直接買,沒有找到就到快包定制開發。我愛方案網積累了一大批方案商和企業開發資源,能提供標準的模塊和核心板以及定制開發服務,按要求交付PCBA、整機產品、軟件或IoT系統。
技術服務靳工:15529315703
