沸腾的数字人:打响大模型产品落地第一枪
大模型时代,真正颠覆性的产品是怎样的?它应该具备大模型的自进化能力,还是能给产业贡献新的生产力工具?抑或是重构企业的经营管理模型?
数字人,正在给出一个答案。
作者|皮爷
出品|产业家
“大模型如何往下走?”
6月底,一个投资机构举办的以大模型为主题的闭门会上,这个话题被提出,并迅速引发了在座参与者们的广泛讨论,甚至,这种“讨论”也可以称为“探索”。
这种关注度也更在成为整个大模型市场的缩影。在长达12个月的技术参数竞赛后,人们越来越真实地发现,尽管AI和其它技术不同,其具备广泛的认知和重构产业的能力,但就当下而言,距离真正的产业AGI仍有不小的距离。
这种距离的具体表现则是——2024年的如今,大模型仍然很难在产业细分场景里成功落地。
根据一份不完全数据统计,在过去的一段时间里,尽管对AI进行尝试的企业不计其数,但真正将AI在企业内部落地的比例不超过10%。
大模型的下一步应该怎么走?或者对这个问题更细致的拆解是:如何让大模型保持持续进步和落地?
在刚刚过去的WAIC大会上,一个被广泛提及的点是压降幻觉率和AI应用,这些在会上被展示出来的应用遍布各行各业,如工业、金融、教育、农业等等,而具体到产业的环节,也更覆盖如内部管理、营销、物流、数据运营等等。
而在其中,数字人是最受到关注的方向之一。“数字人是现在为数不多能落地、被应用、且可以看得到效果的AI应用。”一位大会的参观者告诉产业家。
实际上,如果把视角聚焦到这个在大模型之前就出现的赛道身上,则是不难发现,伴随着大模型的出现,数字人赛道正在迎来新的重构,这种重构不仅在产品形态、技术突破,也在其在产业场景里带来的价值。
“我们认为数字人或将是AIGC时代代表性的颠覆性产品。”京东科技人工智能业务负责人告诉产业家。一个足够真实的数据是,京东云言犀数字人如今已经累计服务品牌超5000家,带动GMV超过百亿,而如今伴随着数字人被越来越多的企业使用,这个GMV还正在加速跃升。
“大模型落地应用先行,应用驱动大模型进化”。数字人,正在打响这个飞轮的第一枪。
一、 “数字人+大模型”,
跨过产业“恐怖谷”
恐怖谷效应,一直是数字人赛道的发展掣肘。即尽管在过去的几年时间里,从事数字人的企业和服务商不在少数,但由于其一直存在“恐怖谷效应”,所以数字人的落地一直处于不愠不火的状态。
而更拆解来看,这种恐怖谷则体现在数字人的动作灵活度、语言回复(交互)、自然姿势展现等多个纬度。
一位数字人公司的CTO曾告诉产业家,“在学术界和工业界,做数字人一般会使用‘微妙’这个词,因为一个微小的差别,都能被人们感觉到。”
“这个赛道的整个产业链仍然不完善,包括硬件这些,尽管直播和培训有不少企业选择采买,但核心技术还是不到位,很多企业甚至会自己用免费的技术搭建一个,效果都大差不差。”一位地方文旅负责人表示。
但这个掣肘在4月16日晚的京东采销直播间被“动摇”。在当天晚上18点,“采销东哥AI数字人”进行了其在京东直播的首秀,包括人物造型、口音贴合度、动作姿态都与真人差别度极小,甚至偶尔还能飙出几句“宿迁话”,其首秀不到1小时,直播间观看量就超过2000万,带货GMV更超5000万。
“数字人,已经跨过了‘恐怖谷’。”该负责人告诉我们,根据他介绍,在京东内部,一个被力争达成的目标是“120s测试”,即如果在120s之内观众没有辨别出屏幕上的人为数字人,那么就可以称之为跨过“恐怖谷”,而如今,这个挑战已经基本被完成。
这并不是一件容易的事。简单的介绍是,目前行业内对于数字人的构建流程环节往往采取的是“建模—驱动—渲染”的方式,但如果想要达成“自然无异”,甚至超过120s的真人效果,每个环节都需要做到完美,这还包括NLP、TTS的挑战都必须攻克。
“京东云言犀数字人是端到端的视频生成模式”该负责人告诉我们。Sora就是端到端的典型代表,但我们发现Sora生成的视频仍经常出现不合理的地方,比如扭曲的肢体动作。“真正商用还要面对幻觉问题,我们在幻觉压降这块下了很多功夫,因为幻觉这类情况在商业上是不被允许的。”他补充。
数据显示,在“采销东哥AI数字人”之外,在今年京东618期间,还有格力董明珠、海信胡剑涌、LG李东善、名创优品叶国富、洁丽雅石展承等超18位总裁数字人,都已经走向台前,成为品牌新的直播法宝。
也可以说,伴随着大模型的出现,AI数字人正在释放出更强的实用价值和更看得到的商业模式,不论是采销东哥AI数字人,还是在品牌直播间愈发高频出现的数字人主播,都在昭示着AI数字人这个颠覆性大模型产品的成熟。
但在数字人本身之外,如果从AI的视角来看,“大模型+数字人”到底意味着什么?
二、真实的数据闭环,
和新“AI生产力”工具
关于大模型,行业内有一个共识的说法,即不论如何“要先让大模型跑起来”。在过去半年的大模型论坛或者圆桌会议上,这个说法已经成为共识。
原因为何?
答案仍然是数据。众所周知,对这波浪潮的主角之一OpenAI而言,在过去的近2年时间里,其最大的资金投入之一是算力成本,不论是A100、H800还是其它系列的GPU,对应的都是天价投入,这种大投入也更催生出了GPT到4.0版本的更新迭代。
但明眼人能看到的是,从GPT4.0到5.0,乃至后续的规划上,OpenAI放缓了相应的产品更新节奏。
实际上,在算力之外,一个在如雪球般滚动的成本也更在成为OpenAI的资金大头,甚至占比越来越高,它就是数据。如果说从小学到大学的通识教育,对应的是互联网线上的基础数据样本,那么从大学到对应领域的深造学习,需要的则是更为真实且高质量的数据,对模型进行训练。
但这些数据,有尽头。在不久前的一次科技论坛上,月之暗面创始人杨植麟也曾明确表示,大模型现阶段的难点是如何找到更多更真实的数据,但这样的数据现在很难找到,甚至是否真实存在,他的态度是“不确定”。
从行业视角来看,关于大模型训练的进阶数据有两种方式最为主流。一是利用大模型生成数据,但需要在消除幻觉的基础上;另一类是“创造真实的数据”,也就是寻找能跑起来的AI应用。
对前者而言,这仍然是个数据是否真实的伪命题。但对于后者,如今已经有跑出来的答案,它就是数字人。
能清晰看到的是,在AI数字人被一次次使用的当下,它也更在通过一次次真实的交互生成出更为高质量的数据,进而反馈大模型训练,推动整个闭环乃至大模型飞轮效应的形成。
这种闭环的形成并非偶然,甚至也更可以成为一整个AI工程的长期落地。在京东内部,早在2018年开始,多模态人机交互项目就已经开始投入研发,而在如今生成式AI的催化下,它更是向前一步。
在大模型本身的幻觉层面,京东内部团队也更是下了很大功夫。“我们认为如果大模型不解决幻觉问题,不对其进行极致的压降,AI大模型很难成为未来真正的产业大厦。”京东科技人工智能负责人告诉我们。
据了解,目前京东压降幻觉率的主要方式是向量数据库+优质数据。
从2019年开始,京东就开始研发向量数据库,历经电商大促场景磨练,如今其向量数据库Vearch已经能支撑百亿级高性能检索,延时降低到毫秒级。京东在垂直行业的知识沉淀更是丰富,言犀大模型训练时就用了70%通用数据和30%的供应链原生数据。
而从大模型的角度来看,基于AI数字人构建起来的这种飞轮也更具其特殊之处。即不论是其产品背后对应的大模型能力,还是如今发挥作用和价值的场域——电商平台,都对应的不仅是大模型某单项能力的锻炼,或反馈,而更多是集合全部模态的实战考校和磨练。
在这种丰富的实战中,“大模型—应用—数据反馈—训练”的飞轮在加速运转。
三、数字人背后的「AI产品启示录」
其实,数字人的价值还不仅于此。电商直播之外,在金融、教育、员工培训、企业数字员工等等越来越多的场景里,它都在成为新的AI生产力角色。
在大模型发展的如今,我们一直尝试解答一个问题:大模型时代,真正颠覆性的产品是怎样的?它应该具备大模型的自进化能力,还是能给产业贡献新的生产力工具?抑或是重构企业的经营管理模型?
数字人,正在给出一个答案。在大模型从技术渐进式到产业颠覆式发展的当下,作为已经落地的大模型产品,数字人已经跨越了“AI+”,正式进入AI重构的时期。
首先,从技术来看,作为大模型的集大成者,不论是生成数字人的方式和步骤,抑或是其如今展现出来的能力,都有足够的技术支撑,跨过“恐怖谷”,达到真正商用的阶段,而配上如今低成本的配置,企业可以低门槛尝试。
其次,从具体的效果而言,作为使用数字人的企业,都可以基于数字人改变自身的企业经营管理方式。以电商为例,在直播、数字人回复、AI外呼等等各方面,数字人都在构建一种新的交互方式,帮助企业更好地传递声音,创造价值。
同样,在商业化角度也更是如此,即作为一种SaaS形态,能清晰感知到的是AI数字人已然颠覆过去以往市场对SaaS产品低粘性、高流失、难定制的印象,其某种程度更等同于企业的“固定员工”。
可以说,作为如今唯一可落地、可大范围时间的AI产品,数字人在将大模型技术的颠覆性在无数的产业场景中逐一展现,并且贡献出AI原生的“颠覆式”增量。
实际上,这也正是京东的思考。即在如今的大模型时代中,京东一直以来的口号是向产业进发。
在过去的一年时间里,在强大的基座大模型之上,外界能看到的是京东似乎一直基于数字人发力,不论是东哥直播,还是帮助品牌伙伴的CEO做数字人,以及在金融、文旅等等方向进行的数字人的落地,外界也更在对这种“单一的声音”提出质疑。
但这背后对应的是京东一直定位的产业大模型思维。即相较于市面上大模型厂商在小参数、开源、闭源等越来越多概念上的争论,京东所做的只有一点——寻找当下阶段中大模型能力的最佳、最实用释放点,兼备AI力、产品力、价值力、生产力,如今这个答案已经给出,正是数字人。
肉眼可见的是,京东云言犀数字人已经成为无数企业真实使用的大模型产品,不仅电商,也不仅直播。而在不经意间,在数字人这个最具落地的AI大模型方向,不论是技术、落地、场景,还是商业化服务体系,京东都已然成为国内最佳领跑者。
但还不止于此,在如今的京东内部,类似数字人这种兼备产品和生产力价值的颠覆式产品方向也在被加速寻找、研发。
“我们在大模型方向,更多追求的是一种双赢的模式,最终希望数字人这些AI产品能够给品牌商家带来价值,他们也愿意为之付费,建立一种良性的循环。”上述负责人告诉我们。
以数字人为起点,在大模型时代,京东正在给出属于自己的回答。