文 | 智能相對論
作者 | 陳泊丞
2019年,彼時的AI賽道還不像今天這么熱。
這一年,人工智能連續第三年出現在政府工作報告中,政策關鍵詞從“加快”“加強”轉變為“深化”,開始進入行業需求快速增長的應用探索期。而華為也在這個階段完成了初步的戰略布局和自主技術儲備,向更深層次邁進。科大訊飛也前瞻性地聯合多家國內廠商圍繞根技術進行科研攻關,并希望通過一系列自主創新,提升AI領域的自主化水平,從而真正與國際科技巨頭們能在同一起跑線上進行競爭。相似的經歷、一致的目標,讓科大訊飛和華為意識到對根技術的探索任重道遠,并開始尋求深度的合作。
本土科技廠商的雙向奔赴:“敢用-真用-會用-用好”步步深入
回顧訊飛星火大模型和華為昇騰的合作之路,科大訊飛副總裁、AI工程院院長潘青華梳理出了四個關鍵階段,即“敢用-真用-會用-用好”,雙方在每一個階段都遇到了大量的問題、顧慮,最終攜手克服困難,才把原生創新的路徑走通。在與昇騰合作之前,科大訊飛就已經做了很多技術上的行動,比如自研深度學習并行訓練框架和訓推工具鏈,基于國內優秀軟硬件基礎設施打造穩定高效的大規模深度學習訓練平臺等等,但是在核心算力層面上始終沒有很好的國產化解決方案,算力資源成了本土科技廠商發展AI大模型的一個關鍵限制。在這種情況下,科大訊飛走出了“敢用”的第一步。
隨著對根技術需求的認識加深以及對昇騰AI平臺性能的了解,科大訊飛開始嘗試基于昇騰AI進行模型訓練和推理工作。昇騰以其高度專業的服務態度和服務能力,全力支持訊飛AI訓練移植優化,包含語音識別、語音理解、機器翻譯等模型在昇騰算力資源上的移植適配。這讓科大訊飛與昇騰AI的合作繼續進入了“真用”階段,開始尋求發展中解決大模型訓練推理的核心難題。
以國內首個支持萬億參數大模型訓練的智算集群“飛星一號”正式上線為標志性節點,科大訊飛不僅在業界首創基于RoCE的大規模無損組網,還與昇騰AI聯合解決500余次軟硬件問題,首次實現千億參數大模型訓練效率達到業界水平。在這個過程中,科大訊飛與昇騰AI共同攻堅克難,解決大規模集群訓練中保存斷點后性能“抖動”、性能“爬坡”等疑難雜癥。有了這些成功的探索與驗證,科大訊飛與昇騰AI的合作進入了以原生創新為主導的“會用”階段,雙方在根技術上的攻關取得顯著回饋。
基于昇騰硬件親和特性,科大訊飛對星火大模型的模型結構進行重新設計,不僅讓星火大模型訓練性能較之前提升10%,還創新實現了混合長序列并行算法,促使星火大模型在昇騰上的長序列性能提升了15%。今年6月,科大訊飛正式發布完全基于昇騰算力訓練的星火大模型V4.0,其中星火V4.0在國內外中英文12項主流測試集的8項中,實現了對GPT-4Turbo的超越,成功晉升為業界領先的通用大模型底座。
未來,科大訊飛將繼續思考如何進一步“用好”昇騰AI,面向更大規模集群和更大規模訓練任務,共同探索如何持續挖潛集群性能、大模型推理性能如何進一步提升等等一系列問題。
一路走來,步步深入,科大訊飛與昇騰AI從最初的接觸探索到后來的深入協同,再到原生創新的成功實踐,雙方以深度合作的姿態,在AI原生創新之路上越走越堅定。
本土化技術創新完成了一次很好的驗證
本土化技術創新難在兩大方面,一是技術難做,沒有解題思路,二是項目難堅持,沒有持續解決問題的理念,往往就會無疾而終。這是一段長期的探索歷程,技術決定了起步,而理念決定了起步后的發展是否能長期。
一、技術與理念的雙向奔赴。
科大訊飛與昇騰AI的這場合作之所以能成功,不僅是技術層面的深入協同,還有理念層面的雙向奔赴。比如針對大規模集群訓練兩個月后“越訓越慢”的問題,科大訊飛與昇騰AI通過集合通信-驅動-內核的層層分析,最終發現操作系統內核問題,導致算子下發時間變長、訓練性能下降,才有了后續的解決方案。
二、互為反哺的價值共生。
此次合作中,業界看到的更多是科大訊飛基于昇騰AI完成了一系列成就,但與此同時,昇騰AI也在接受反哺??拼笥嶏w深入參與并助力昇騰持續完善面向大模型的軟件生態,共同開發和優化了基礎算子和通信算子共120多個,基于底層開放API接口也開發了自定義融合算子30多個。同時,雙方共同組建的聯合項目組還推動了昇騰工具50多項關鍵特性的開發,促使Mindstudio工具不斷完善,也持續豐富了昇騰的大模型工具集。
好的合作關系一定是互相成就的,雙方在本次合作中收獲的巨大成果便是具象化呈現,若要實現本土化技術創新,就應該在互為反哺的價值共生關系中去尋求答案。
三、惠及產業發展的生態成果。
科大訊飛和昇騰AI的這場合作,在惠及企業自身的同時,也在推動著中國AI產業的跨越發展。比如,雙方聯合打造的國內首個支持萬億參數規模大模型訓練的智算集群“飛星一號”,大幅提升我國在人工智能領域的行業競爭力。接下來雙方將繼續深入探索未來中國人工智能產業發展的關鍵問題,相信將有更多技術創新與生態成果,更廣泛地惠及千行萬業。
大模型原生創新時代開了個好頭
科大訊飛和昇騰AI的雙向奔赴為中國AI產業發展開了一個好頭。正如潘青華院長在演講中強調,“只有持續跑得快才能最終跑得贏。”中國AI產業發展需要持續跑得快。
現階段,“原生創新”概念經常被行業所提及。但大部分的討論只停留在了應用原生創新之上,認為只要把AI應用孵化在技術平臺上,就是做到了原生創新,往往卻忽視了根技術的原生創新。
如果孵化到國外的技術平臺,做到了應用的原生創新,那確實是“跑得快”,但是能“持續”嗎?其中客觀存在的不穩定性和高風險,或許會在未來的某天突然“暴雷”,給企業經營和產業發展帶來不可挽回的損失。
而只有基于根技術的自主創新,放在自家的技術平臺上孵化、培育,那才有“持續跑得快、跑得穩”,最終“跑得贏”,跑向一個真正的大模型原生創新時代??拼笥嶏w和昇騰AI就一直在為這樣的時代而努力。
基于訊飛星火醫療大模型平臺和昇騰AI基礎軟硬件,科大訊飛與華為聯合打造了一體化醫療健康私有化解決方案。同時,訊飛醫療還攜手華為,與四川大學華西醫院達成了三方戰略合作伙伴關系,共同圍繞創新醫療服務模式、改善就醫體驗、醫療大模型技術應用等重點領域展開深入合作。
這將是醫療大模型應用落地的一個里程碑,未來一個“AI為每個醫生打造診療助理,為每個居民打造健康助手的世界”或許很快就會到來。那么,站在社會民生的角度來看,大模型原生創新時代的到來,不僅僅是對產業發展有助益,更將是AI普惠社會民眾的開端。
據多家媒體統計,2024年上半年,在已公開的行業大模型中標信息中,科大訊飛的合同數量、合同金額均保持行業領先,行業場景逐步拓寬。今天,隨著AI賽道越來越熱,千行萬業都在向AI領域發起沖鋒,而產業經濟的高質量發展需要持續跑得快、跑得穩,最終才能跑得贏。這一目標離不開本土企業對根技術的攻關以及對原生創新的堅持。
在訊飛星火與昇騰AI的雙向奔赴中,業界看到了一條從技術攻關到應用探索的完整路徑。以此為標桿,中國的AI產業又完成了一次探索驗證,將跨入一個更穩定、堅實的發展新階段。
*本文圖片均來源于網絡
此內容為【智能相對論】原創,
僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。
部分圖片來自網絡,且未核實版權歸屬,不作為商業用途,如有侵犯,請作者與我們聯系。
•AI產業新媒體;
•澎湃新聞科技榜單月度top5;
•文章長期“霸占”鈦媒體熱門文章排行榜TOP10;
•著有《人工智能 十萬個為什么》
•【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫療、機器人、物聯網、AI+金融、AI+教育、AR/VR、云計算、開發者以及背后的芯片、算法等。