京东加入牌局,为何“言犀”大模型只针对数智供应链产业?

2023-07-31 17:48:10

来源:商业新知网

刘强东曾在2017年表示,AI不仅是一种技术,也是一种思考方式。他甚至想象过京东未来实现无人办公的场景。在当前的技术大变革时期,公司的命运正处于关键的转折点。刘强东意识到,大型模型这种颠覆性技术的影响是无法忽视的。那么,京东将如何应对这场技术革命呢?


(资料图)

面对这场底层冲击,不同的企业采取了不同的策略。自创立以来,京东已经从中关村的一个柜台发展成为拥有5家上市公司和3家正在寻求上市的公司集团,与阿里巴巴、腾讯和字节跳动相比,京东的业务场景更加复杂和多元,涉及物流、零售、金融、健康和工业等领域。

京东的产业场景多元化以及天然的to B(面向商业)市场特点,使其对大型模型服务产业的需求更加迫切。因此,京东成为了大型模型落地产业的最佳实践场所,其多元化的产业场景和天然的to B市场使其对大型模型服务产业的需求更加强烈。

京东对AI的理解

2023年2月,京东宣布将发布服务产业的大模型,这一消息在京东集团内部引起了高度关注并被提升到了更高的优先级,京东成立了专门的大模型项目组。

大模型的训练需要大量的产业数据做预训练,这些数据分布在京东零售、健康、物流、金融等各个产业线。因此,集团协调各个BG(事业群)和BU(事业部)都参与大模型项目。

何晓冬博士,京东探索研究院院长及京东科技智能服务与产品部总裁,同时也是京东自研“言犀大模型”的核心科学家,他指出,以零售为例,人们的购物行为通常是事件驱动的,即从“我要买什么”开始,但随着大模型技术的应用,购物行为可能从“我要干什么”开始,这意味着购物行为包括了小红书的种草、抖音的内容以及京东的货架,混合了多种形态。

京东围绕着数智供应链积累下的高质量原生数据,而剩下70%来源于通用数据。为了处理行业数据并将其转化为可供机器学习的格式,还需要对数据进行脱敏、分类以及加权处理。不同行业的数据加权系数也不同,例如金融领域的业务数据权重会更多一些,以帮助员工更好地把控风险;而在零售领域,又需要根据不同类型的业务单元(如仓储、商城、社区团购、到家、超市等)对细分的业务场景的重要性进行不同的加权处理。

在基础设施上,京东云建立了一个集成了英伟达最先进的计算和连接设备的机房,拥有超过1000张(A100)显卡。京东还在同步采用大模型改造内部流程,发起了一个名为“效能提升”的项目,让程序员运用大模型产品工具来提高敲代码、写注释以及测试案例的效率。综合评估下来,业绩平均估计提升了20%以上。

在产品层面上,除了智能客服外,京东开始内部测试言犀大模型在诸多业务场景中的应用。比如在产品搜索与推荐方面,电商将很快从“万事皆搜索”进入到“万事皆服务”的时代。

何晓东认为生成式人工智能是一个与移动互联网时代完全不同的物种。 与移动互联网时代相比,京东的探索更具前瞻性,更适合商业。他预测,现在大型模型技术已经到了需要通过产品证明其价值的阶段,它提高了生产力,最终会服务于各个行业,所以一定要到行业去。

“技术和产品其实是有差距的,AI技术要更贴近产品,更深入理解用户需求和使用场景。” 数字经济应用实践专家骆仁童博士指出,产品必须是从用户的角度出发,技术是从创新的角度出发。

这意味着,大模型与产业的结合越深,产生的价值就越大。

京东的“言犀”大模型

京东正式推出的大模型名为“言犀”,据介绍,这个模型已经达到了千亿级别的参数规模,具备了基础层、模型层、MaaS和SaaS四层体系。内含多个行业知识库,为企业提供百余种训练和推理优化工具。

其中,基础层提供了公有云、专有云和混合云三种云计算部署方案;模型层的数据构成中,70%是通用域数据,30%来自京东数智供应链的产业数据;算法层面则采用了分布式训练框架(Megatron+DeepSpeed)和京东自研向量数据库Vearch;而MaaS层则是基于言犀大模型解耦出的底层能力。

目前京东已经将大模型能力融入到京东零售、金融、健康等领域的成熟业务产品中。例如,智能客服、多模态数字人、交互式营销、智能政务热线、协同办公等。京东云还提供了从10亿级到千亿级的大模型,以及大模型和小模型的搭配使用。

此前的发布会还公布了京东在具身智能方向的局部成果。在现场播放的视频中,京东探索研究院院长何晓冬直接与一只集成具身智能的机械臂进行了多轮对话,机械臂流畅地帮何晓冬接了一杯咖啡。

同时,京东提出了大规模模型产业落地的“新三要素”:场景、产品、算力。即复杂的交互式智能场景和产生的动态数据,从单一算法竞争到形成能够引发系统性算法创新和突破的产品,以及能够支撑这种场景和系统的新算力。

最后,京东还宣布“言犀”大模型将实施“三步走”战略:目前,京东云已经基于内部实践构建了通用大模型;到今年年底这段时间,京东将经由高复杂场景大规模锤炼,迭代出扎实的产业服务;预计在2024年初,会将大模型能力向外部严肃商业场景开放。

从目前进展来看,“言犀”的“三步走”战略已经走过了一半。或许,真正的挑战要等到明年京东正式向行业场景开放“言犀”大模型的能力时才会到来。

大模型的“京东模式”

国内“遍地开花”的大模型,主要有“通用模式”和“垂直模式”两种形态,然而,与通用模式和垂直模式不同的是,京东认为言犀大模型是一种“供应链模式”。

通用模式的大模型如ChatGPT,虽然精度高且应用广,但对数据和算力的要求极高,成本也很高昂。这使得许多小公司难以实现C端的大模型变现路径。同时,这些大模型也经常出现“一本正经瞎编”的现象,暴露了专业领域知识储备不足的问题。因此,很多公司更倾向于有具体场景的行业大模型。

相比之下,垂直模式的大模型更适合付费能力更强的B端客户。例如,腾讯云最近推出了金融、政府、教育等一系列行业大模型,华为也发布了面向政务、金融、制造、矿山等行业的“盘古3.0”大模型。这些垂直模式的大模型可以为行业提供更实际的商业化选择。

数字经济应用实践专家骆仁童博士表示,从ChatGPT引发科技领域的热潮,到各类大型模型纷纷涌现,再到产业落地,无论哪一种AI模型的模式,都已经有相对应的应用场景,可以预见,新一轮的人工智能浪潮将加速渗透各行各业。

众多业界人士都认为“所有行业都值得再次融合AI大模型”,不过实际情况是,并非所有行业都能立即采用。当前阶段,要实现真正可用的大型模型,仍需要科技公司和行业用户的紧密合作。京东的言犀大模型的“供应链模式”是基于京东在零售、物流、健康、金融等行业的知识积累,结合低门槛、高效率的生产平台,为客户提供一站式的大模型服务。

如果AI是一条河,那么各家公司的产品方案有的是架桥,有的是造船,各有不同,但最早AI都将加速渗透各行各业。人工智能是一项严肃的技术革命,谁最终越过科学研究到实际产品转化,需要长期主义的心态和实践的历练。

关键词: