沸騰的數字人：打響大模型產品落地第一槍

新視界作者產業家 / 砍柴網 / 2024-07-29 20:41

大模型如何往下走？

大模型時代，真正顛覆性的產品是怎樣的？它應該具備大模型的自進化能力，還是能給產業貢獻新的生產力工具？抑或是重構企業的經營管理模型？

數字人，正在給出一個答案。

作者|皮爺

出品|產業家

“大模型如何往下走？”

6月底，一個投資機構舉辦的以大模型為主題的閉門會上，這個話題被提出，并迅速引發了在座參與者們的廣泛討論，甚至，這種“討論”也可以稱為“探索”。

這種關注度也更在成為整個大模型市場的縮影。在長達12個月的技術參數競賽后，人們越來越真實地發現，盡管AI和其它技術不同，其具備廣泛的認知和重構產業的能力，但就當下而言，距離真正的產業AGI仍有不小的距離。

這種距離的具體表現則是——2024年的如今，大模型仍然很難在產業細分場景里成功落地。

根據一份不完全數據統計，在過去的一段時間里，盡管對AI進行嘗試的企業不計其數，但真正將AI在企業內部落地的比例不超過10%。

大模型的下一步應該怎么走？或者對這個問題更細致的拆解是：如何讓大模型保持持續進步和落地？

在剛剛過去的WAIC大會上，一個被廣泛提及的點是壓降幻覺率和AI應用，這些在會上被展示出來的應用遍布各行各業，如工業、金融、教育、農業等等，而具體到產業的環節，也更覆蓋如內部管理、營銷、物流、數據運營等等。

而在其中，數字人是最受到關注的方向之一。“數字人是現在為數不多能落地、被應用、且可以看得到效果的AI應用。”一位大會的參觀者告訴產業家。

實際上，如果把視角聚焦到這個在大模型之前就出現的賽道身上，則是不難發現，伴隨著大模型的出現，數字人賽道正在迎來新的重構，這種重構不僅在產品形態、技術突破，也在其在產業場景里帶來的價值。

“我們認為數字人或將是AIGC時代代表性的顛覆性產品。”京東科技人工智能業務負責人告訴產業家。一個足夠真實的數據是，京東云言犀數字人如今已經累計服務品牌超5000家，帶動GMV超過百億，而如今伴隨著數字人被越來越多的企業使用，這個GMV還正在加速躍升。

“大模型落地應用先行，應用驅動大模型進化”。數字人，正在打響這個飛輪的第一槍。

一、 “數字人+大模型”，

跨過產業“恐怖谷”

恐怖谷效應，一直是數字人賽道的發展掣肘。即盡管在過去的幾年時間里，從事數字人的企業和服務商不在少數，但由于其一直存在“恐怖谷效應”，所以數字人的落地一直處于不慍不火的狀態。

而更拆解來看，這種恐怖谷則體現在數字人的動作靈活度、語言回復（交互）、自然姿勢展現等多個緯度。

一位數字人公司的CTO曾告訴產業家，“在學術界和工業界，做數字人一般會使用‘微妙’這個詞，因為一個微小的差別，都能被人們感覺到。”

“這個賽道的整個產業鏈仍然不完善，包括硬件這些，盡管直播和培訓有不少企業選擇采買，但核心技術還是不到位，很多企業甚至會自己用免費的技術搭建一個，效果都大差不差。”一位地方文旅負責人表示。

但這個掣肘在4月16日晚的京東采銷直播間被“動搖”。在當天晚上18點，“采銷東哥AI數字人”進行了其在京東直播的首秀，包括人物造型、口音貼合度、動作姿態都與真人差別度極小，甚至偶爾還能飆出幾句“宿遷話”，其首秀不到1小時，直播間觀看量就超過2000萬，帶貨GMV更超5000萬。

“數字人，已經跨過了‘恐怖谷’。”該負責人告訴我們，根據他介紹，在京東內部，一個被力爭達成的目標是“120s測試”，即如果在120s之內觀眾沒有辨別出屏幕上的人為數字人，那么就可以稱之為跨過“恐怖谷”，而如今，這個挑戰已經基本被完成。

這并不是一件容易的事。簡單的介紹是，目前行業內對于數字人的構建流程環節往往采取的是“建模—驅動—渲染”的方式，但如果想要達成“自然無異”，甚至超過120s的真人效果，每個環節都需要做到完美，這還包括NLP、TTS的挑戰都必須攻克。

“京東云言犀數字人是端到端的視頻生成模式”該負責人告訴我們。Sora就是端到端的典型代表，但我們發現Sora生成的視頻仍經常出現不合理的地方，比如扭曲的肢體動作。“真正商用還要面對幻覺問題，我們在幻覺壓降這塊下了很多功夫，因為幻覺這類情況在商業上是不被允許的。”他補充。

數據顯示，在“采銷東哥AI數字人”之外，在今年京東618期間，還有格力董明珠、海信胡劍涌、LG李東善、名創優品葉國富、潔麗雅石展承等超18位總裁數字人，都已經走向臺前，成為品牌新的直播法寶。

也可以說，伴隨著大模型的出現，AI數字人正在釋放出更強的實用價值和更看得到的商業模式，不論是采銷東哥AI數字人，還是在品牌直播間愈發高頻出現的數字人主播，都在昭示著AI數字人這個顛覆性大模型產品的成熟。

但在數字人本身之外，如果從AI的視角來看，“大模型+數字人”到底意味著什么？

二、真實的數據閉環，

和新“AI生產力”工具

關于大模型，行業內有一個共識的說法，即不論如何“要先讓大模型跑起來”。在過去半年的大模型論壇或者圓桌會議上，這個說法已經成為共識。

原因為何？

答案仍然是數據。眾所周知，對這波浪潮的主角之一OpenAI而言，在過去的近2年時間里，其最大的資金投入之一是算力成本，不論是A100、H800還是其它系列的GPU，對應的都是天價投入，這種大投入也更催生出了GPT到4.0版本的更新迭代。

但明眼人能看到的是，從GPT4.0到5.0，乃至后續的規劃上，OpenAI放緩了相應的產品更新節奏。

實際上，在算力之外，一個在如雪球般滾動的成本也更在成為OpenAI的資金大頭，甚至占比越來越高，它就是數據。如果說從小學到大學的通識教育，對應的是互聯網線上的基礎數據樣本，那么從大學到對應領域的深造學習，需要的則是更為真實且高質量的數據，對模型進行訓練。

但這些數據，有盡頭。在不久前的一次科技論壇上，月之暗面創始人楊植麟也曾明確表示，大模型現階段的難點是如何找到更多更真實的數據，但這樣的數據現在很難找到，甚至是否真實存在，他的態度是“不確定”。

從行業視角來看，關于大模型訓練的進階數據有兩種方式最為主流。一是利用大模型生成數據，但需要在消除幻覺的基礎上；另一類是“創造真實的數據”，也就是尋找能跑起來的AI應用。

對前者而言，這仍然是個數據是否真實的偽命題。但對于后者，如今已經有跑出來的答案，它就是數字人。

能清晰看到的是，在AI數字人被一次次使用的當下，它也更在通過一次次真實的交互生成出更為高質量的數據，進而反饋大模型訓練，推動整個閉環乃至大模型飛輪效應的形成。

這種閉環的形成并非偶然，甚至也更可以成為一整個AI工程的長期落地。在京東內部，早在2018年開始，多模態人機交互項目就已經開始投入研發，而在如今生成式AI的催化下，它更是向前一步。

在大模型本身的幻覺層面，京東內部團隊也更是下了很大功夫。“我們認為如果大模型不解決幻覺問題，不對其進行極致的壓降，AI大模型很難成為未來真正的產業大廈。”京東科技人工智能負責人告訴我們。

據了解，目前京東壓降幻覺率的主要方式是向量數據庫+優質數據。

從2019年開始，京東就開始研發向量數據庫，歷經電商大促場景磨練，如今其向量數據庫Vearch已經能支撐百億級高性能檢索，延時降低到毫秒級。京東在垂直行業的知識沉淀更是豐富，言犀大模型訓練時就用了70%通用數據和30%的供應鏈原生數據。

而從大模型的角度來看，基于AI數字人構建起來的這種飛輪也更具其特殊之處。即不論是其產品背后對應的大模型能力，還是如今發揮作用和價值的場域——電商平臺，都對應的不僅是大模型某單項能力的鍛煉，或反饋，而更多是集合全部模態的實戰考校和磨練。

在這種豐富的實戰中，“大模型—應用—數據反饋—訓練”的飛輪在加速運轉。

三、數字人背后的「AI產品啟示錄」

其實，數字人的價值還不僅于此。電商直播之外，在金融、教育、員工培訓、企業數字員工等等越來越多的場景里，它都在成為新的AI生產力角色。

在大模型發展的如今，我們一直嘗試解答一個問題：大模型時代，真正顛覆性的產品是怎樣的？它應該具備大模型的自進化能力，還是能給產業貢獻新的生產力工具？抑或是重構企業的經營管理模型？

數字人，正在給出一個答案。在大模型從技術漸進式到產業顛覆式發展的當下，作為已經落地的大模型產品，數字人已經跨越了“AI+”，正式進入AI重構的時期。

首先，從技術來看，作為大模型的集大成者，不論是生成數字人的方式和步驟，抑或是其如今展現出來的能力，都有足夠的技術支撐，跨過“恐怖谷”，達到真正商用的階段，而配上如今低成本的配置，企業可以低門檻嘗試。

其次，從具體的效果而言，作為使用數字人的企業，都可以基于數字人改變自身的企業經營管理方式。以電商為例，在直播、數字人回復、AI外呼等等各方面，數字人都在構建一種新的交互方式，幫助企業更好地傳遞聲音，創造價值。

同樣，在商業化角度也更是如此，即作為一種SaaS形態，能清晰感知到的是AI數字人已然顛覆過去以往市場對SaaS產品低粘性、高流失、難定制的印象，其某種程度更等同于企業的“固定員工”。

可以說，作為如今唯一可落地、可大范圍時間的AI產品，數字人在將大模型技術的顛覆性在無數的產業場景中逐一展現，并且貢獻出AI原生的“顛覆式”增量。

實際上，這也正是京東的思考。即在如今的大模型時代中，京東一直以來的口號是向產業進發。

在過去的一年時間里，在強大的基座大模型之上，外界能看到的是京東似乎一直基于數字人發力，不論是東哥直播，還是幫助品牌伙伴的CEO做數字人，以及在金融、文旅等等方向進行的數字人的落地，外界也更在對這種“單一的聲音”提出質疑。

但這背后對應的是京東一直定位的產業大模型思維。即相較于市面上大模型廠商在小參數、開源、閉源等越來越多概念上的爭論，京東所做的只有一點——尋找當下階段中大模型能力的最佳、最實用釋放點，兼備AI力、產品力、價值力、生產力，如今這個答案已經給出，正是數字人。

肉眼可見的是，京東云言犀數字人已經成為無數企業真實使用的大模型產品，不僅電商，也不僅直播。而在不經意間，在數字人這個最具落地的AI大模型方向，不論是技術、落地、場景，還是商業化服務體系，京東都已然成為國內最佳領跑者。

但還不止于此，在如今的京東內部，類似數字人這種兼備產品和生產力價值的顛覆式產品方向也在被加速尋找、研發。

“我們在大模型方向，更多追求的是一種雙贏的模式，最終希望數字人這些AI產品能夠給品牌商家帶來價值，他們也愿意為之付費，建立一種良性的循環。”上述負責人告訴我們。

以數字人為起點，在大模型時代，京東正在給出屬于自己的回答。

分享到

數字人 AI

聲明：砍柴網尊重行業規范，任何轉載稿件皆標注作者和來源；砍柴網的原創文章，請轉載時務必注明文章作者和"來源：砍柴網"，不尊重原創的行為將受到砍柴網的追責；轉載稿件或作者投稿可能會經編輯修改或者補充，有異議可投訴至：post@ikanchai.com

您想第一時間獲取互聯網領域的資訊和商業分析，請在微信公眾號中搜索"砍柴網"或者"ikanchai"，或用微信掃描左邊二維碼，即可添加關注，從此和砍柴網建立直接聯系。

沸騰的數字人：打響大模型產品落地第一槍

相關推薦

最新文章

熱文導讀

“特斯拉又割了我 7 萬塊”

用 eSIM 取代手機卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級新功能”？網友：炒華為冷飯！

谷歌Pixel 6真機曝光：最美安卓屏幕沒跑了！

iPhone 13機模曝光：值得等！

蘋果計劃在美國生產 Apple Car 汽車電池

關注我們

沸騰的數字人：打響大模型產品落地第一槍

相關推薦

最新文章

熱文導讀

“特斯拉又割了我 7 萬塊”

用 eSIM 取代手機卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級新功能”？網友：炒華為冷飯！

谷歌Pixel 6真機曝光：最美安卓屏幕沒跑了！

iPhone 13機模曝光：值得等！

蘋果計劃在美國生產 Apple Car 汽車電池

關注我們

用 eSIM 取代手機卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級新功能”？網友：炒華為冷飯！

谷歌Pixel 6真機曝光：最美安卓屏幕沒跑了！

iPhone 13機模曝光：值得等！